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Abstract: The invention relates to the tumour-associated antigen B345 and to DNA molecules which code for the same. 
Zusammenfassung: Tumorassoziiertes Antigen B345 und dafiir kodierende DNA-Molekule. 
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TUMORASSOZIIERTES ANTIGEN (B345) , GEKENNZEICHNET DURCH EINE AMINOSAURESEQUENZ 
WIE IN SEQ. ID. NO. 4 

5 Die Erf indung bezieht sich auf die Chemotherapie von 
Tumorerkrankungen . 

Normale Korperzellen unterliegen einem strikt geordneten 
System, das das Wachstum, die Zellteilung und das 
Absterben bestimmter Zellen kontrolliert . So teilen sich 

10 Korperzellen einer erwachsenen Person nur dann, wenn sie 
tote Zellen ersetzen oder eine Verletzung verheilen 
mussen. Krebszellen dagegen wachsen unkontrolliert 
weiter, sie akkumulieren und bilden einen Tumor. 
Erreicht der Tumor eine kritische Grdfie, konnen 

15 Krebszellen iiber die Blutbahnen oder das Lymphsystem 

auch in andere Bereiche des Korpers transportiert werden 
und dort Kolonien bilden (Metastasen) . Nicht alle Tumore 
sind kanzerogen, denn benigne Tumore metastasieren nicht 
und sind daher meistens nicht lebensgef ahrlich, da sie 

20 chirurgisch entfernt werden konnen. Detailliertere 

Informationen zu diesem Thema sowie den weiter unten 
diskutierten Aspekten der Tumorentstehung geben folgende 
Publikationen: Rauscher und Vogt, 1997; Kastan, 1997; 
Hesketh, 1995; Pusztai, Lewis und Yap, 1995. 

25 Die Transformation einer gesunden Zelle in eine 

Krebszelle kann durch eine ganze Reihe von Faktoren, wie 
Umwelteinf lusse, Strahlung f Viren oder chemische 
Reagenzien ausgelost werden. Bei der Tumorentwicklung 
spielen jedoch auch epigenetische (Methyl ierungen, 



Acetylierungen und verSnderte Chromatinstruktur) und 
genetische Modifikationen (Punkt mutation, Deletion, 
Amplif ikation, Translokation) eine bedeutendende Rolle. 

Mutationen in kodierenden Bereichen von Genen, die an 
5 der Regulation der Zell -Proliferation beteiligt sind, 
konnen an der Uberfuhrung einer normalen Zelle in eine 
Tumorzelle beitragen, da die transformierte Zelle 
Wachstumsvorteile gegeniiber ihrer gesunden Nachbarzelle 
hat. 

10 Krebs entsteht also durch eine Ansammlung von vererbten 
oder erworbenen Mutationen in kritischen Protoonkogenen 
oder Tumor suppressorgenen. 

Die Zellproliferation steht unter der Kontrolle 
verschiedener Gensysteme, wahrend Produkte von Onkogenen 

15 an der Signalvermittlung von Zelloberf lache zum Zellkern 
beteiligt sind, geleiten cyclinabhangige Proteinkinase 
und ihre Inhibitoren die Zelle durch den Zellzyklus. 
Nicht selten werden Storungen in der Synthese dieser 
Proteine bei Tumorzellen gefunden. Eine zentrale Rolle 

20 spielt dabei das p53 -Protein. 

Proteine vom Typ des RB- Proteins regulieren die 
Verfiigbarkeit entscheidender Transkriptionsfaktoren. 

Die in Tumorgeweben hochregulierten Gene stellen'meist 
den Ausgangspunkt fur weitere detaillierte Analysen dar 
25 und da Proteine verschiedenster Funktionen 

hochexprimiert werden, ist der Ansatz fur therapeutische 
Interventionen sehr vielseitig. Es ist daher das Ziel 
der Krebsforschung weitere neue Zielmolekule (sog. 
„Targets") fur therapeutische Interventionen zu finden, 
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die dann fiir eine gezielte Therapie mit geringen 
Nebenwirkungen benutzt werden konnen. 

In erster Linie gilt es daher molekulare Veranderungen 
zwischen Normalgewebe und Tumor auf dem Niveau der 
5 Genexpression ( ^ranskriptionslevel" ) aufzudecken, die 
einerseits neue Targets identif izieren sollen und 
andererseits fiir die Entwicklung bzw. das Auffinden von 
Substanzen zur Hemmung von Fehlf unktionen herangezogen 
werden konnen. 

10 Eine ganze Reihe verschiedenster Methoden zur 

Identif izierung und Charakterisierung von neuen Targets, 
die den Ausgangspunkt fiir die Entwicklung von neuen 
Therapeutika darstellen, basieren auf der Erstellung 
dif f erenzieller mRNA Transkriptionsprof ile zwischen 

15 Tumoren und Normalgeweben. Dazu zahlen die 

dif f erenzielle Hybridisierung, die Erstellung von 
Subtraktions-cDNA-Banken ("representational difference 
analysis"; Hubank und Schatz, 1994; Diatchenko et al . , 
1996) und der Einsatz der DNA-Chip Technologie oder der 

20 SAGE-Methode (Velculescu et al . , 1995). 

Neben immuntherapeutischen Ansatzen kommt der gezielten 
Chemotherapie eine wesentliche Rolle bei der Behandlung 
von Krebs zu. Unter Chemotherapie versteht man die 
Verabreichung von Substanzen, die durch Eingriff in 

25 Stof fwechsel, Signaltransduktion und 

Zellteilungsvorgange maligner Zellen entweder 
zytostatisch oder zytotoxisch-zytolytisch wirken. 
Chemotherapeutika lassen sich auf Grund der 
Beeinf lussung von spezifischen Targets in der 

30 Tumorzelle, nach Art der zellularen Interaktion und der 
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Wechselwirkung mit einer bestimmten Zellzyklusphase, in 
verschiedene Kategorien unterteilen. 

Die Art der Krebsbehandlung hangt vom Tumorstadium ab, 
entscheidend ist dabei, ob bereits Metastasen vorhanden 
5 sind und wie weit diese im Korper verbreitet sind. Die 
Applikation von Zellgiften zur Krebsbehandlung ist, 
neben operativen Malinahmen und der Strahlentherapie, ein 
integraler Bestandteil der heutigen Therapiekonzepte in 
der Onkologie. 

10 Im wesentlichen gibt es zwei Hauptziele der 

Chemotherapie: In erster Linie ist es die Heilung von 
Krebs; das bedeutet, dass der Tumor verschwindet und 
nicht mehr auftritt. Ist eine Heilung aus 
verschiedensten Grunden nicht mehr moglich, versucht man 

15 den Tumor in seinem Wachstum und seiner Ausbreitung 
einzuschranken bzw. zu kontrollieren. 

Prinzipiell entfalten Substanzen, die bei der 
Chemotherapie Anwendung finden, ihre Wirkung bei alien 
sich teilenden Zellen. Tumorzellen zeigen jedoch eine 
20 hohere Empf indlichkeit gegenuber Chemotherapeutika als 
gesunde Zellen, da hauptsachlich stark proliferierende 
Zellen angegriffen werden. 

Jedes Gewebe halt ein charakteristisches Wachstums- 
verhalten, das Zellteilung, Wachstumsstillstand, 
25 Dif ferenzierung und Alterung umfasst und durch interne 
und externe Faktoren beeinflusst und reguliert wird. 

Viele der heute eingesetzten zytotoxischen 
Chemotherapeutika wirken nur bei proliferierenden Zellen 
(nicht in der GO -Phase der Zellteilung) . Dabei werden 
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allerdings sowohl Normal- als auch Krebszellen 
attackiert. Die Zerstorung von normalen Zellen kann zu 
starken Nebenef f ekten ftihren; z.B. Zerstorung der 
Blutzellen-produzierenden Gewebe des Knochenmarks 
5 (Myelosuppression) . 

Chemotherapeutika werden je nachdem, wie sie spezifische 
Substanzen innerhalb der Tumorzelle beeinf lussen, mit 
welchen zellularen Prozessen die Medikamente 
interagieren und welche Zellzyklusphase sie 
10 beeinf lussen, in verschiedene Kategorien unterteilt. 

Diese Inf ormationen sind fur Onkologen notwendig fur die 
Entscheidung welche Praparate bei der Therapie 
miteinander kombiniert werden konnen. 

Die in Tumorgeweben hochregulierten Gene stellen somit 
15 potentielle neue Zielstrukturen dar und da Proteine 
verschiedenster Funktionen hochexprimiert werden, ist 
der Ansatz fur therapeutische Interventionen sehr 
vielseitig. 

Es ist daher das Ziel der Krebsf orschung, weitere neue 
20 Targets fiir therapeutische Interventionen zu finden, die 
dann fur eine gezielte Therapie mit - verglichen mit 
derzeitig eingesetzten Therapeutika - geringeren 
Nebenwirkungen benutzt werden konnen. 

In Tumorgeweben hochregulierte Gene stellen 
25 Angrif f spunkte und somit potentielle Zielstrukturen 
(„Targets") fur die Chemotherapie dar. 

Aufgabe der vorliegenden Erfindung war es, ein neues, 
bevorzugt von Tumorzellen exprimiertes Protein 
bereitzustellen, das ein Zielmolekul fiir die 
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Intervention mittels chemotherapeutischer Methoden 
darstellt . 

Diese Aufgabe wurde gelfist, indem zunSchst mittels RDA 
(^representational difference analysis") zwischen einer 
5 Lungen-Adenokarzinom-Zelllinie (A549) und 

Normal lungengewebe eine cDNA-Substraktionsbibliothek 
hergestellt wurde. Zur Selektion der im Tumor 
uberexprimierten Antigene wurden anschlieliend die 
erhaltenen cDNA-Klone sequenziert und mit in Datenbanken 

10 verfiigbaren Sequenzen verglichen- Unter den dabei 

annotierten Genen befanden sich 321 unbekannte, zu denen 
groBtenteils ESTs ("expressed sequence tags") -Eintrage 
in der Datenbank existierten. Nach einer weiteren 
qualitativen PCR-Analyse in cDNA-Bibliotheken von 

15 kritischen Normalgeweben und immunprivilegierten Geweben 
sowie detail lierteren Datenbankrecherchen wurde die 
Anzahl der Kandidatenklone auf 59 eingeschrankt, deren 
ESTs nicht aus kritischen Normalgeweben stammen. 

Diese Klone wurden auf Incyte DNA Chips gespottet und 
20 mit einer ganzen Reihe von Tumorgeweben und 

Normalgeweben als Referenz hybridisiert . Das mRNA 
Expressionsprofil von EST Fragmenten, die in 
Krebsgeweben und Normalgeweben dif ferentiell exprimiert 
werden und zu einem noch unbekannten Gen gehoren, wurde 
25 mit unterschiedlichen Methoden verifiziext. 

Die Lange der Transkripte wurde mittels Northern blot 
Analyse bestimmt und das Expressionsmuster in 
verschiedenen Zellsystemen durch quantitative PCR exakt 
charakterisiert . Nur unbekannte Gene bzw. ESTs mit 
30 tumorspezif ischen Expressionsprofil wurden 
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weiterverf olgt und einer "full length Klonierung" 
unterworfen. Potent ielle ORFs ("open reading frames") 
werden in die entsprechende Aminosauresequenz 
umgewandelt und zur moglichen Funktionsvorhersage 
5 mittels in silico Strategien analysiert. 

Die humane B34 5- cDNA wurde kloniert, die in einem ersten 
Klonierungsansatz erhaltene Sequenz ist in SEQ ID NO:l 
dargestellt. Die Sequenzanalyse der in diesem Ansatz 
klonierten humanen B345-CDNA zeigte einen durchgehenden 

10 offenen Leserahmen von Position 215 bis Position 24G1 
(exklusive Stopcodon) , der, auf Nukleotid- und 
Proteinebene, in den bekannten Sequenzen der Datenbanken 
keine Homologie oder Identitat aufweist. Aus den aus 
. Northern Blot Experimenten gewonnenen Daten ist zu 

15 schlieflen, dass das B345-Transkript eine Lange von ca. 
6,5 kb hat. In einem ersten Ansatz wurde als klonierter 
Bereich eine B345 -cDNA mit 5897 bp (exklusive polyA- 
Region) , erhalten, wobei das Vorhandensein eines 
Polyadenylationssignals und des PolyA-Tails am 3'-Ende 

20 der Sequenz auf die VollstSndigkeit der cDNA in diesem 
Bereich hindeutete. Aufgrund der Tatsache, dass im 
5 '-Bereich der klonierten cDNA von Position 1 bis 214 
kein durchgehender Leserahmen aufschien, wurde zunachst 
angenommen, dass es sich bei dem ATG an Position 215, 

2 5 die auch zu 75% einer Kozak Translationinitiationsstelle 
(ACCATGT) (Kozak, 1987) entspricht, urn das Startkodon 
von B345 handelt* 

In einem weiteren Klonierungsansatz wurden mittels einer 
molekularbiologischen Standardmethode, und zwar mittels 
30 sog. „Promotor Finder DNA Walking",, zusatzliche 



Informationen uber die weiter stromaufwSrts liegende 
Sequenz von B345 gewonnen. 

Somit wurde die in dem ersten Klonierunsversuch 
erhaltene B345-Sequenz (SEQ ID N0:1) in der B^Region 
5 erweitert. Der Transkriptionsstart konnte unter 

Anwendung der Primer Extension Analyse genau lokalisiert 
werden und liegt bei Position 201 (SEQ ID NO:3) . Durch 
wiederholte Sequenz ierungen auch in der 3 "Region wurde, 
im Vergleich zur in SEQ ID NO:l dargestellten Sequenz, 

10 eine zusatzliche Base an Position 2430 gefunden, die zu 
einer Leserasterverschiebung fuhrt und somit das 
Stoppcodon von Position 2729 auf 2791 verschiebt. Die 
erhaltene cDNA (SEQ ID NO: 3) besitzt einen offenen 
Leserahmen, der fur ein potentielles Protein mit einer 

15 Lange von 836 Aminosauren (SEQ ID NO: 4) kodiert. Die 

Translationsinitiationsstelle an Position 283 entspricht 
etwa zu 70% einer Kozak-Konsensussequenz. 

Die Promotorregion 200bp upstream der mutmalilichen 
Transkriptionsstartstelle enthalt weder eine TATA noch 
20 eine CCAAT box, jedoch eine eindeutige GC-box, welche 
eine Bindungsstelle des SP1 Proteins darstellt. Die 
Tatsache , dass der GC Gehalt in der 5 "Region tiber 60% 
ist, deutet auf ein CpG Island hin (Bird, 1986) . 

A 

Die resultierende primare Aminosauresequenz von B345 ist 
25 in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz zeigt, dass das B345 Protein 
zwei charakteristische hydrophobe Domanen aufweist, die 
ein Signalpeptid und eine helikale Transmembrandomane 
darstellen (Fig. 6). Diese polarisierte Struktur deutet 
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darauf hin, dass es sich bei B345 urn ein integrales 
Membraneprotein handelt . 

Die extrazellulare Domane lafit auf die Existenz von 
definitiv einer, gegebenenf alls drei, CUB Domanen 
5 schliefien. CUB Domanen kommen bei verschiedenen, meist 
wahrend der Embryonalentwicklung regulierten Proteinen 
vor. Eine kurzlich erschienene Publikation (Gerstein et 
al., 2000) demons triert, daft CUB Domanen enthaltende 
Proteine die am ausgepragtesten dif f erenziell 

10 regulierten Proteine in C. elegans sind. Da Gene, die 
eine Schlusselrolle in der Embryonalentwicklung haben, 
entsprechende Funktionen, z.B. in der Zellteilung, der 
Zellproliferation oder Signalubertragung, in Krebs 
ausfiihren, kann angenommen werden f dass eine 

15 Oberexpression von B345 in Zellen eine VerSnderung in 
den Eigenschaften der SubstratadhSsion oder der 
extrazellularen Matrix bewirkt. Das B345 Protein weist 
12 potentielle N-Glycosylierungsstellen auf, die in der 
mutmaii lichen extrazellularen Domane zu finden sind, 

20 Aufgrund seiner Aminosauresequenz ist anzunehmen, dass 
das B345-Protein eine li-Sheet Sekundarstruktur 
ausbildet, da sich CUB DomSnen bekanntlich als 
fi- Sandwich falten. 

Die intrazellulare Domane (Bereich 691-836) weist keine 
25 signif ikanten Homologien auf. Der gesamte C-Terminus 

zeigt jedoch eine Identitat (82%) uber 124 Aminosauren 
mit einem EST (Acc No. AW063 026) aus humanen 
Eierstockkrebs Zellen. 

Ausgehend von den Funktionen anderer CUB Domanen 
30 enthaltender Proteine kann gefolgert werden, dafi das 
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B345 Transmembranprotein in der Kommunikation, der 
Interaktion und/oder der Signaltransduktion mit 
extrazellularen Komponenten oder Liganden eine Rolle 
spielt. Ferner sind die Daten der Expressionsanalyse ein 
5 starkes Indiz dafiir, dass B345 beim metastatischen 

Prozess von Krebs, insbespndere Dickdarmkrebs, beteiligt 
ist. 

Fur die Aufklarung der physiologischen Funktion und der 
Rolle von B345 bei der Metastasierung sind folgende 
10 Untersuchimgsmethoden geeignet: 

Zunachst werden Zelllinien, vorzugsweise humane 
Zelllinien ident if iziert, z.B. mittels TaqMan PCR, die 
B345 nicht endogen exprimieren. Die Zellen werden mit 
einem Plasmid, das die B345-Sequenz enthalt, 

15 transf iziert und B345 exprimiert. Anderungen in der 
Morphologie und/oder dem Migrationsverhalten, das z.B, 
mittels Softagar Assay (Hamburger und Salmon, 1977) oder 
Migrationsassay (Liaw et al; 1995) der B345 
exprimierenden Zellen gegenuber den nicht-transfizierten 

20 Zellen deuten auf eine Rolle von B345 in dem dafiir 

ver ant wort lichen biologischen Prozess hin. Dies ist ein 
deutlicher Hinweis auf eine Beteiligung von B345 an der 
Interaktion von Tumor zellen untereinander und/oder mit 
der extrazellularen Matrix und somit auf eine Funktion 

25 bei der Metastasierung. 

Alternativ bzw. zusatzlich zu dieser Funktionsanalyse 
wird in einem komplementaren Ansatz die Expression von 
B345 in Zellen, die dieses Protein endogen exprimieren, 
unterdruckt f urn ebenfalls die etwaige Anderungen in 
30 Morphologie und/oder Migrationsverhalten festzustellen. 
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Aufierdem wird gegebenenf alls untersucht, ob 
Proteinkomponenten exist ieren, die mit B345 inter- oder 
extrazellular interagieren (z.B. mittels Yeast Two 
Hybrid System (Fields und Song, 1989) . 

5 Die Erfindung betrifft somit in einem ersten Aspekt ein 
tumorspezif isches Polypeptid mit der Bezeichnung B345, 
mit der in SEQ ID NO: 4 angegebenen Aminosauresequenz 
oder ein Polypeptid, das von einem Polynukleotid kodiert 
wird, das unter stringenten Bedingungen mit einem 
10 Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
oder einer Teilsequenz davon hybridisiert , sowie davon 
abgeleitete Proteinf ragmente oder Peptide. 

In einem weiteren Aspekt betrifft die vorliegende 
Erfindung ein isoliertes DNA-Molekul, kodierend fur das 
15 tumorspezif ische Polypeptid der Bezeichung B345. 

Bevorzugt ist das erf indungsgemafle DNA-Molekul ein 
Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
oder ein Fragment davon oder ein DNA-Molekul, das mit 
einem DNA-Molekul der in SEQ ID NO: 3 dargestellten 
2 0 Sequenz oder einer Teilsequenz davon unter stringenten 

Bedingungen hybridisiert, oder ein Fragment davon. 

J 

Unter „stringenten Bedingungen" wird z.B. verstanden: 
Inkubation liber Nacht bei 65°C - 68 °C mit 6xSSC (lxSSC = 
. 150 mM NaCl, 15 mM Tri-Natriumcitrat ) , SxDenhardt's 
25 Losung, 0.2%SDS, 50 ug/ml Lachsspermien-DNA, daran 

anschlieflend Waschen zweimal 30 min mit 2xSSC, 0.1% SDS 
bei 65°C, einmal 30 min mit 0.2xSSC, 0.1% SDS bei 65°C 
und gegebenenf alls abschlieftendes Spulen mit O.lxSSC, 
0.1%SDS bei 65°C, oder aquivalente Bedingungen. 
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Die erfindungsgemaGen DNA Molekiile kodieren fur 
(Poly) peptide der Bezeichnung B345 mit der in SEQ ID 
NO: 4 dargestellten Aminosauresequenz bzw. fur davon 
abgeleitete Proteinfragmente oder Peptide; damit sind 
5 DNA Molekiile bzw. Fragmente mitumfasst, die durch die 
Degeneration des genetischen Codes Abweichungen von der 
in SEQ ID NO: 3 dargestellten Sequenz aufweisen 

In einer Ausfiihrungsform der Erfindung betrifft die 
Erfindung ein isoliertes DNA-Molekul der in SEQ ID NO: 3 
10 dargestellten Sequenz oder ein Fragment davon, oder ein 
DNA-Molekul, das mit einem DNA-Molekul der in SEQ ID 
NO: 3 dargestellten oder mit einer Teilsequenz davon 
hybridisiert, kodierend fiir das natiirliche 
B345-Polypeptid bzw. fiir ein Fragment davon. 

15 Die B345-DNA-Molekule konnen in einer sog. DNA-Vakzine 
fiir die Immuntherapie von Tumoren verwendet werden. 

Dabei konnen die B345-DNA-Molekule der Erfindung, 
vorzugsweise in rekombinanter Form als Plasmide, direkt 
oder als Bestandteil eines rekombinanten Virus, oder 
20 Bakteriums verabreicht werden. Prinzipiell kann jede 
gentherapeutische Methode fiir die Immuntherapie von 
Krebs auf Basis von DNA ( "DNA-Vakzine") auf B345-DNA 
angewendet werden, und zwar sowohl in vivo als auch 
ex vivo. 

25 Beispiele fiir die in vivo Verabreichung sind die direkte 
Injektion von "nackter" DNA, entweder intramuskular oder 
mittels Gen-Pistole ("gene gun") von der sich gezeigt 
hat, dafi sie zur Bildung von CTLs gegen Tumorantigene 
fiihrt. Beispiele fiir rekombinante Organismen sind 

30 Vaccinia Virus, Adenovirus oder Listeria monocytogenes 
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(eine Obersicht wurde von Coulie, 1997, gegeben) . 
Desweiteren konnen synthetische Trager fur 
Nukleinsauren, wie kationische Lipide, Mikrospharen, 
Mikrokiigelchen oder Liposomen fur die in vivo 
5 Verabreichung von Nukleinsaure-Molekulen, kodierend fiir 
B345-Peptid verwendet werden. Verschiedene Hilfsstoffe, 
die die Immunantwort verstarken, konnen mitverabreicht 
werden, z.B. Zytokine, entweder in Form von Proteinen 
oder dafur kodierenden Plasmiden. Die Applikation kann 
10 gegebenenfalls mit physikalischen Methoden, z.B. 
Elektroporation, kombiniert werden. 

Ein Beispiel fiir die ex vivo Verabreichung ist die 
Transfektion dendritischer Zellen, wie von Tuting, 1997, 
beschrieben, oder anderer APCs^die als zellulare 
15 Krebsvakzine zur Anwendung kommen. 

Die vorliegende Erfindung betrifft somit in einem 
weiteren Aspekt die Verwendung von Zellen, die B345 
exprimieren, entweder von sich aus oder, in 
gegebenenfalls modif izierter Form, nach Transfektion mit 
20 der entsprechend kodierenden Sequenz, fiir die 
Herstellung einer Krebsvakzine. 

Alternativ zur natiirlichen B345-CDNA bzw. Fragmenten 
davon kannen modifizierte Derivate verwendet werden. 
Diese umfassen Sequenzen mit Modif ikationen, die fur ein 

25 Protein (fragment) bzw. Peptide mit starkerer 

Immunogenitat kodieren, wobei fur die Modif ikationen auf 
DNA-Ebene dieselben Oberlegungen gelten wie fur die oben 
beschriebenen Peptide. Eine weitere Art der Modif ikation 
ist die Aneinanderreihung zahlreicher Sequenzen, 

30 kodierend fiir immunologisch relevante Peptide, nach Art 
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einer Perlenschnur ("string-of -beads" ; Toes et al., 
1997) . Die Sequenzen konnen auch durch Anfugung von 
Hilfselementen modifiziert werden, z.B. Funktionen, die 
eine ef f izientere Abgabe und Prozessierung des 
5 Irranunogens gewahrleisten (Wu et al., 1995), 
Beispielsweise kann durch Anfiigen einer 
Lokalisierungssequenz in das endoplasmatische Retikulum 
("ER targeting sequence") die Prozessierung und damit 
die Presentation und letztlich die Immunogenitat des 
10 Antigens erhoht werden. 

Die vorliegende Erfindung betrifft in einem weiteren 
Aspekt ein rekombinantes DNA-Molektil, das B345-DNA 
enthalt, z.B, verbunden mit einer regulatorischen 
DNA-Sequenz, insbesondere einer heterologen 
15 regulatorischen DNA-Sequenz, z.B. einem Promoter oder 
Enhancer . 

Die Erfindung betrifft in einem weiteren Aspekt 
Antikorper gegen B345 bzw. Fragmente davon. Polyklonale 
Antikorper konnen in herkommlicher Weise durch 
20 Immunisierung von Tieren, insbesondere Kaninchen, 

mittels Injektion des B 345-Antigens bzw. Fragmenten 
davon, und anschlieJiender Reinigung des Immunglobulins 
erhalten werden. 

Monoklonale anti-B345-Antik5rper k5nnen nach 
25 Standardprotokollen gemali dem von K6hler und Milstein, 
1975, beschriebenen Prinzip gewonnen werden, indem 
Tiere, insbesondere Mause, immunisiert, anschlieBend 
antik6rperproduzierende Zellen der immunisierten Tiere 
immortalisiert werden, z.B. durch Fusion mit 
30 Myelomzellen, und der Oberstand der erhaltenen Hybridome 
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mittels immunologischer Standard- As says auf monoklonale 
anti-B345-Antikorper gescreent wird. Fur den 
therapeutischen oder diagnostischen Einsatz im Menschen 
konnen diese tierischen Antikorper gegebenenf alls auf 
5 herkommliche Weise chimerisiert (Neuberger et al., 1984; 
Boulianne et al . , 1984) oder humanisiert (Riechmann et 
al., 1988; Graziano et al., 1995) werden. 

Humane monoklonale anti-B345-AntikQrper (f ragmente) 
kdnnen auch von sog. "Phage Display Libraries" (Winter 
10 et al., 1994; Griffiths et al . , 1994; Kruif et al . , 

1995; Mc Guineas et al . , 1996) und mittels transgener 
Tiere (Bruggemann et al., 1996; Jakobovits et al., 1995) 
gewonnen werden. 

Die erf indungsgemalien anti-B345-Antikorper konnen in 
15 immunhistochemischen Analysen fur diagnostische Zwecke 
eingesetzt werden, oder als Therapeutikum in der 
Krebstherapie. (Ein Beispiel fur die erfolgreiche 
Anwendung eines monoklonalen Antikorpers in der 
Krebstherapie ist Herceptin; ein Antikorper gegen das 
20 Proto-Onkogen HER2 . Herceptin kann in Brustkrebs- 

Patienten angewendet werden, die eine Uberexpression von 
HER2 aufweisen.) 

In einem weiteren Aspekt betrifft die Erfindung die 
Verwendung von B345-spezif ischen Antikorpern, urn 

25 beliebige Substanzen selektiv zu bzw. in einen Tumor zu 
bringen, der B345 exprimiert. Beispiele fur solche 
Substanzen sind zytotoxische Agenzien oder radioaktive 
Nuklide, deren Wirkung darin besteht, den Tumor Vorort 
zu schadigen. Aufgrund der relativ tumorspezif ischen 

30 Expression von B345 sind dabei nur geringe 
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Nebenwirkungen zu erwarten. In einem weiteren Aspekt 
konnen mit Hilfe von B345-Antik6rpern Substanzen zur 
Sichtbarmachung von Tumoren, die B345 exprimieren, 
herangezogen werden. Dies ist fttr die Diagnose und die 
5 Bewertung des Therapieverlaufs von Nutzen. 

Therapeutische und diagnostische Anwendungen von 
Antikorpern, die fur anti-B345-Antikorper in Frage 
kommen, sind in der WO 95/33771 beschrieben. 

Das Protein der Bezeichnung B345 gemafi der vorliegenden 
10 Erfindung und die davon abgeleiteten Proteinfragmente, 
Peptide bzw. Peptid-Aquivalente oder Peptidomimetika 
konnen in der Krebstherapie eingesetzt werden, z. B. urn 
eine Immunantwort gegen Tumorzellen zu induzieren, die 
die entsprechenden Antigen-Determinant en exprimieren. 
15 Vorzugsweise werden sie fur die Therapie von 

B345-positiven Tumoren verwendet, insbesondere beim 
Lungen- und Kolonkarzinom. 

B345 bzw. Peptide, Peptid-Aquivalente und 
Peptidomimetika konnen fur die Immuntherapie von Krebs 
20 eingesetzt werden, wie z.B. in der WO 00/73438 
beschrieben, auf deren Offenbarung hiermit Bezug 
genommen wird. 

Es ist bekannt, dass tumorassoziierte Antigene 
tumorspezifische Mutationen aufweisen konnen, die zu : 

25 einer immunologischen Unterscheidung zwischen Tumor und 
Normalgewebe beitragen (Mandruzzato et al.# 1997; Hogan 
et al., 1998; Gaudi et al. f 1999; Wolfel et al.,1994)- 
Urn das Vorhandensein tumorspezif ischer B345 -Mutationen 
festzustellen, wird, zweckmaMg mit Hilfe von Sonden aus 

30 der erf indungsgemafien isolierten cDNA, die B345-cDNA aus 
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einem oder mehreren unterschiedlichen Tumoren kloniert 
und die erhaltenen Sequenzen mit Normalgewebs-B345-cDNA 
verglichen. Es werden Versuche durchgefuhrt , die zeigen 
sollen, ob Tumor-B345-Peptide aus einem gegeniiber 
5 Normalgewebs-B345 mutierten Sequenzabschnitt im 
Vergleich zu Normalgewebs-B345-Peptiden aus dem 
entsprechenden Abschnitt eine verstarkte Immunogenitat 
aufweisen. Um zu bestatigen, dass etwaige Mutationen 
tumorspezif isch sind, konnen Antikorper gegen diese 
10 Bereiche generiert und Tumorzellen auf Expression von 
moglichen Mutationen untersucht werden. 

Die vorliegende Erfindung betrifft somit in einem 
weiteren Aspekt B345-Peptide, abgeleitet von Bereichen 
eines tumorexprimierten B345, die tumorspezif ische 
15 Mutationen aufweisen. 

Auf Grund der bevorzugten Expression von B345 in 
Tumorzellen kann angenommen werden, dass dieses Protein 
eine wichtige Funktion fur den Tumor hat, z.B. fur 
Entstehung, Infiltration und Wachstum und somit ein 
20 Target fur die chemotherapeutische Intervention 
darstellt . 

Im Hinblick auf seinen Einsatz als Target in der 
gezielten Chemotherapie wird B345 naher charakterisiert, 
um die geeignete Strategie fur die Intervention mit 
25 dieser Funktion zu entwickeln. 

Als ersten Schritt bei der sog. "down- stream" 
Funktionsanalyse von B345 fiihrt man zweckmaflig in einem 
ersten Schritt eine bioinformatische Analyse durch, die 
den fur die experimentelle Validierung von B345 als 
30 Target richtungweisend ist. 
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Fur diese Analyse stellen die auf Ahnlichkeit und 
modularer Struktur beruhenden Bioinformatik-Konzepte 
eine wesentliche Grundlage dar. Etablierte 
bioinformatische Hilfsmittel zur Feststellung von 
5 Ahnlichkeiten sind BLAST 

( ht tp ; / /www . ncbi . nlm . nih . gov/BLAST , Altschul et al., 
1997) oder FASTA (Pearson & Lipman, 1988), die 
spezialisierten Datenbanken wie Pfam 

( http : //www . Sanger . ac . uk/Pf am , Bateman et al., 2000) und 

10 SMART ( http : //smart . embl -heidelberg . de , Schultz et al., 
2000), welche Domanenstrukturen berucksichtigen. Zur 
Verfeinerung der Analyse konnen Applikationen wie 
Clustal ( http : //www2 . ebi . ac . uk/clustalw , Higgins et al . , 
1996) HMMer ( ht tp : //hmmer . wust 1 . edu ) # PSI-BLAST 

15 (Altschul et al-, 1997) und die PROSITE Datenbank 
( http ; / / www . expasy . ch/prosite , Hofmann et al., 1999) 
herangezogen werden. Statist ische Analysemethoden, die 
nicht auf Homologien beruhen, gestatten die Vorhersage 
weiterer struktur- und funktionsrelevanter Eigenschaf ten 

20 wie der Sekundarstruktur und des Auftretens von 

Transmembransegmenten und Helix-Turn-Helix-Motiven. 
Methoden zur Vorhersage der Sekundarstruktur von 
Proteinen sind verfugbar; besonders erwahnenswert ist 
Jpred ( http : //barton . ebi . ac . uk/servers/ jpred. html , Cuff 

25 et al., 1998). Die Sekundarstrukturvorhersage kann 

Funktionshypothesen untermauern, etwa wenn' die Struktur 
des vermuteten Homologen bekannt ist. 

GemalJ Bioinformatikanalyse weist B345 eine helikale 
Transmembrandomane auf, wobei sowohl der N-terminale als 
30 auch der C-terminale Bereich hydrohpil sind, was darauf 
schlieflen lasst, dass dieses Protein ein 
Transmembranprotein darstellt. Der N-terminale, 
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extrazellulare Bereich besitzt einige CUB-Domanen, 
welche zu Disulf idbruckenbildung neigen und daher bei 
der Dimerisierung bzw. bei Protein -Protein 
Wechselwirkungen beteiligt sind (Bork et al . , 1993). Das 
5 C-terminale, intrazellulare Ende zeigt Homologien zu 
einer Rezeptorkinase und zu einem C-Kinase Substrat . 

In weiterer Folge wird B345 einer biochemischen und 
biologischen Analyse unterworfen. 

In einem nachsten Schritt wird die Funktion von B345 fur 

10 das Tumorgeschehen aufgeklart; z.B. durch 

Proliferationsassays in vitro oder in Tiermodellen, die 
das zu untersuchende B345-Gen uberexprimieren 
(konstitutiv oder induzierbar) und als Kontrolle 
entweder in deletierter (inaktiver) Form exprimieren 

15 oder uber Antisense hinunteregulieren (siehe z.B. 
Grosveld und Kollias, 1992) . 

B345 kann in Screening-Assays verwendet werden, urn 
Substanzen zu identif izieren, die die Aktivitat dieses 
Proteins modulieren, insbesondere inhibieren. In einer 

20 Ausfiihrungsf orm kann ein derartiger Assay z. B. darin 
bestehen, das B345 Protein, oder ein aktives Fragment 
davon, in Zellen, die auf die Aktivitat von B345 mit 
Proliferation reagieren, einzubringen bzw. die 
entsprechende B345 cDNA in der Zelle zur Expression zu 

25 bringen, und die Proliferation der Zellen in Gegenwart 
und in Abwesenheit einer Testsubstanz zu bestimmen. 

Ein Beispiel fur Testzellen sind Zellen mit niedriger 
Teilungsrate, z.B. primare Zellen, die kein endogenes 
B345 aufweisen. Um die Eignung der Zellen fur einen 
30 Screening-Assay f estzustellen, werden diese mit 
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B345-CDNA transformiert, gezuchtet und mit Standard- 
Assays, z.B. Thymidin-Einbau, auf ihre 
Proliferationsfahigkeit getestet. Aufgrund einer nach 
B345-Expression signifikanten Erhohung ihrer 
5 Proliferationseigenschaft konnen sie als Testzellen 
eingesetzt werden, z.B. in High Throughput Screening 
Proliferationsassays. Beispiele fur Proliferationsassays 
im High Throughput Format, z.B. auf Grundlage des MTS- 
Assays, sind in der WO 98/00713 beschrieben. 

10 Substanzen mit proliferationshemmender Wirkung konnen 
zur Behandlung von Tumoren mit starker B34 5 -Expression 
verwendet werden, insbesondere beim Lungen-und 
Kolonkarzinom. 



15 Figurenubersicht : 

Fig. 1A: Expressionsprof il von B345, B452 und B540 in 
individuellen Lungenkarzinomen und 
Lungentumorzelllinien. 

Fig. IB: Expressionsprof il von B345 in normalem 
20 Dickdarmgewebe und Tumorzelllinien. 

Fig. 1C: Graphische Darstellung des Alignments von 
B345, B452 und B540. 

Fig. 2A: Northern Blot Analyse der Tumorzelllinie A549 
mit einem 490bp langem B345 PCR-Produkt 



25 Fig. 2B: 



Northern Blot Analyse verschiedener 
Normalgewebe mit einem 490bp langem B345 
PCR-Produkt 
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Fig. 2C: Northern Blot Analyse verschiedener 

Krebsgewebe mit einem 318bp langen B345 
PCR-Produkt 

Fig, 3 mRNA Expressionsanalyse von B345 durch 
5 real-time PCR von Tumor- und Normal -Geweben. 

Fig. 4: mRNA Expressionsanalyse von B345 durch 

real-time PCR von Laser-Mikroskop-praparierten 
Dickdarmtumoren (LCM) sowie normalem 
Dickdarmgewebe und Tumor zelllini en. 

10 Fig. 5: Graphische Darstellung der Genstruktur von 
B345. 

Fig. 6: HydrophilizitSts-und Transmembran-Blot des 
B345-Proteins 

Fig. 7: Potentielle Proteinstruktur von B345 

15 



Tabellenubersicht 

Tab . 1 : Zusammenf assung der Northern Blot Daten von 
B345 in verschiedenen Normalgeweben (1A) , 
20 Krebszelllinien (IB) ; und verschiedenen 

Normalgeweben im Vergleich mit dem 
entsprechenden Tumorgewebe (1C) 
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Tab. 



2A: 



Zusammenf assung der Daten der quant i t at iven 
PCR von B345 in verschiedenen Normal- und 
Krebsgeweben 
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Tab. 2B: Zusammenfassung der Daten der quant i tat iven 
PGR von B345 in verschiedenen Normalgeweben 
und mikrodissektierten Kolonadenokarzinom 
Geweben 

5 

Zeichenerklarung 



+++ extrem positiv 

++ stark positiv 

+ positiv 

10 (+) schwach positiv 



negativ 

Beispiel 1 

RDA ( Representational Difference Analysis*) von der 
15 humanen Adenokarzinom-Zelllinie der Lunge (A549) und 
normalem Lungengewebe 

Die von ATCC bezogene humane Lungenadenokarzinom- 
Zellinie A549 (CCL 185) wurde in T150 Zellkulturf laschen 
hochgezuchtet. Als Nahrmeclium diente MEM mit 10% hitze- 

20 inaktiviertem, fotalem Kalberserum und 2 mM L-Glutamin. 
Alle 3 bis 4 Tage wurden die Zellen durch Trypsinisieren 
1:5 bis 1:10 zur Propagation gespalten. Nach Erreichen 
von etwa 80% Konfluenz wurden pro T150 Zellkulturf lasche 
4 ml einer Trypsinlosung (Angaben pro Liter: 8g NaCl, 

25 0,2g KC1, l,13g Na 2 HP0 4 -wasserfrei, 0,2g KH 2 P0 4 , 

100ml 2,5% Trypsinlosung, lg EDTA-Na-Salz; pH 7,2 - 7,4) 
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zum Ernten der Zellen eingesetzt. Die 4 ml wurden in ein 
15 ml Falconrohrchen transf eriert , mit 8 ml PBS 
versetzt, bei 1200 rpm in einer Haereus Tischzentrif uge 
(Megafuge 2 . OR) 5 min bei 4°C zentrif ugiert , das 
5 Zellpellet mit 1 ml Lysis-Puffer (lOmM Tris-HCl pH8, 
140mM NaCl, 1,5 mM MgCl 2 , 0,5% NP40) versetzt, kraftig 
geschiittelt und in einem 2 ml Eppendorf gef afi> bei 
12 000 rpm .und 4°C 5 min in einer Sigma Tischzentrif uge 
(Sigma 202 MK) abzentrif ugiert ♦ Der Oberstand wurde in 

10 ein neues Eppendorf gef aft transferiert und nach Zusatz 
von 55 pi 20% SDS-Losung zweimal mit dem doppelten 
Volumen an einer CHCl 3 /Phenol (1:1 v/v) Mischung und 
einmal mit dem einfachen Volumen an CHC1 3 extrahiert. Die 
wassrige RNA-enthaltende Phase wurde mit 1/10 Volumen an 

15 3M NaAc (pH5) und dem zweifachen Volumen an 96% EtOH 

versetzt und liber Nacht bei -20°C die RNA prazipitiert . 
Ausgehend von 1 mg Gesamt-RNA wurde fur die Isolierung 
von poly-A(+)RNA mittels des PolyATtract Kit (Promega) 
entsprechend dem Hersteller-Protokoll vorgegangen. Die 

20 Lagerung der A549 poly-A(+)RNA mit einer Konzentration 
von 1 mg/ml in DEPObehandeltem H 2 0 erfolgte in Aliquot s 
bei -80°C. 

Zur Durchfuhrung der reprasentativen Dif f erenzanalyse 
(RDA; Hubank and Schatz, 1994; Diatchenko et al . , 1996) 

25 wurde die poly-A(+)RNA der Lungenadenokarzinom-Zellinie 
A549 als „tester xx f die von normalem Lungengewebe 
(1 mg/ml; Clontech, Palo Alto; #6524-1) als „driver" 
eingesetzt. Die RDA wurde unter Verwendung des 
PCR-select™ kit (Clontech, Palo Alto) entsprechend dem 

30 Hersteller-Protokoll durchgefuhrt, mit der Ausnahme, 
dass ein modif iziertes Primer/Adaptor-2- 
Oligonukleotidsystem zum Einsatz kam: Adaptor- 2 -alt- 1 
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(SEQ ID NO: 31) und nested-PCR-primer-2-alt 
(SEQ ID NO: 32) und Adaptor-2-alt-2 (SEQ ID NO: 33). Die 
neu generierten Primer/Adaptor-Sequenzen ermoglichen 
durch die Anwesenheit von drei neuen 
5 Restriktionsenzymschnittstellen (Kpn I, Sac I und Xho I) 
in der Sequenz des nested-PCR-primer-2-alt nach 
Klonierung der subtrahierten cDNA- Fragment e in den 
pPCRII-Vektor ein nachtrSgliches Herausschneiden der 
jeweiligen cDNA- Fragment e. Das Designen einer 
10 Primer/Adaptorsequenz mit mehreren verfiigbaren 

Restriktionsenzymschnittstellen war deshalb notwendig, 
weil besonders in den Primersequenzen - bedingt durch 
die PCR-Amplifikationsschritte- oft Punktmutationen zu 
beobachten war en. 

15 Nach der Synthese von doppelstrSngiger cDNA mittels 
oligo-dT wurde die erhaltene cDNA von "tester" und 
"driver" mit i?sal verdaut (Rsal ist ein 4-Basen 
erkennendes Restriktionsenzym und liefert im 
statistischen Mittel 256 bp lange cDNA- Fragment e) . 

20 Gleiche Teile von "tester-cDNA" wurden entweder mit den 
Adaptoren 1 oder 2 ligiert und anschliefiend getrennt mit 
einem Oberschuss an "driver-cDNA" bei 65 °C hybridisiert . 
Danach wurden die beiden Ansatze vereinigt und einer 
zweiten Hybridisierung mit frischer denaturierter 

25 11 driver- cDNA" unterworfen. Die angereicherten "tester"- 

4.' 

spezifischen cDNAs wurden anschliefiend durch PCR, mit 
fur die Adaptoren 1 bzw. 2 spezifischen Primern, 
exponentiell amplifiziert. Fur eine weitere Anreicherung 
wurde ein Aliquot dieser Reaktion einer zweiten PCR mit 
30 spezifischen nach innen versetzten ("nested") Primern 
unterworfen. Die aus dieser Reaktion resultierenden, 
exponentiell amplif izierten cDNA- Fragment e wurden direkt 
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in den pCRII-Vektor (Invitrogen; "TA-cloning vector" ) 
ligiert und anschlieftend ein Drittel des 
Ligationsansatzes in kompetente E. coli (OneShot™, 
Invitrogen) transf iziert . 

5 712 positive Transf ormanten (Blau-Weili-Selektion) wurden 
erhalten und in 96-Napf Blocken in LB-Amp Medium (1,3 ml 
pro Napf) fur 48 h bei 37°C kultiviert. Pro Napf wurden 
750 pi der E. coli Suspensionen fur die Preparation der 
Plasmid-DNA eingesetzt (96-Napf- Minipraparationsmethode 
10 von QIAgen nach Vorschrift des Herstellers) . Die 
verbleibenden Bakterienkulturen wurden als 
Glycerinstammkulturen bei -80 °C gelagert. 

Es wurde eine aus 712 Einzelklonen bestehende cDNA- 
Subtraktionsbibliothek erhalten, die sowohl in Form von 
15 E. coli Glycerin- Stammkulturen als auch in Form 
gereinigter Plasmide vorlag. 

Beispiel 2 

DNA-Sequenzierung und Annotation von TAA-Kandidaten 

20 Die isolierte Plasmid-DNA samtlicher 712 Klone (siehe 
Beispiel 1) wurde nach der S anger- Me thode auf einem 
ABI-377 Prism GerSt sequenziert. Die erhaltenen 
Sequenzen wurden mittels der BioScout-Sof tware (LION, 
Heidelberg) annotiert und Datenbankvergleichen (Genbank) 

25 unterzogen. Von 712 Klonen konnten 678 sequenziert und 

annotiert werden. Der Rest (34) wies als Insert entweder 
nur poly (A) Sequenzen auf oder entsprach einem 
religierten Vektor oder war nicht sequenzierbar . Von den 
678 annotierbaren Sequenzen erwiesen sich 357 als Gene 
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mit bekannter Funktion. Die rest lichen 
321 reprasentierten Klone, kodierend fur Gene mit 
unbekannter Funktion; 59 davon wiesen nicht einmal 
EintrSge in der humanen EST-Datenbank auf . Bekannte Gene 
5 wurden nicht weiter behandelt. Fur jene unbekannten 
Gene, fur die ein EST-Eintrag verfugbar war, wurde eine 
. Abschatzung des Expressionsprofils vorgenommen: dabei 
wurden all jene ESTs mit > 95% Identitat (BLAST) , die 
zur entsprechend experimentell ermittelten Sequenz der 

10 Subtraktionsbibliotheken gehorten, iiberpruft, Bei der 
Annotation wurde eine Unterteilung in a) kritische 
Normalgewebe, b) f Stale, "verzichtbare" und 
immunprivilegierte Gewebe und c) Tumore und Tumor- 
Zellinien vorgenommen. Auf der Basis dieses "virtuellen 

15 mRNA-Prof ils" ("virtueller Northern blot") wurden 

200 Klone, fur die keine ESTs in der Gruppe a) gefunden 
wurden, fur weitere experimentelle Analysen ausgewahlt 
(inklusive der 59 Klone, fur die keine EST-Eintragung 
vorlag) . Zur weiteren Einengung der Kandidatenklone 

20 wurden aus den von den 200 ausgewahlten Klonen 
ermittelten Sequenzen Oligonukleotidprimerpaare 
entworfen und synthetisiert . Es wurden zunachst 
8 verschiedene, von humanem Gewebe abgeleitete 
cDNA-Bibliotheken (GibcoBRL "SUPERSCRIPT™") , welche 

25 direktional in pCMV-SPORT kloniert sind, mittels 

qualitativer PCR auf das Vorhandensein der jeweiligen 
Kandidaten getestet. Die dabei eingesetzten 
cDNA-Bibliotheken stammten aiis Gewebe von Herz 
(#10419-018), Leber (#10422-012), Leukozyten 

30 (#10421-022), Niere (#10420-016), Lunge (#10424-018), 
Testis (#10426-013), Gehirn (#10418-010) und fotalem 
Gehirn (#10662-013). Die PCR-Bedingungen waren wie 
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folgt: 20 |al Gesamtvolumen pro PCR-Ansatz enthielten 
1 x TaqPol-Puffer (50mM KC1, 10 mM Tris-HCl pH9, 
0,1% Triton X-100) , 1,5 mM MgCl 2 , 0,2 mM dNTPs (Promega) , 
0,025 U/pl Taq-DNA-Polymerase (Promega), jeweils 5 pM an 
5 spezifischen Oligonukleotidprimer fur B345 (B345-D, 

SEQ ID NO: 34) und (B345-U, SEQ ID NO: 35) sowie 100 ng 
der jeweils zu untersuchenden Plasmid-DNA. Zur Kontrolle 
wurden spezifische Primer fur GAPDH (SEQ ID NO: 36 
und 37) eingesetzt. Zur Oberprufung des selektiven 

10 Nachweises wurden die jeweiligen B345 spezifischen 

Primerpaare Oligonukleotidprimer (SEQ ID NO: 34) und (SEQ 
ID NO: 35) parallel auch auf das isolierte Plasmid mit 
dem B345 "original Fragment" 'hin ausgetestet 
(ursprunglich isoliertes cDNA-Fragment von B345) . Die 

15 Nachweisbarkeit von Fragmenten der zu erwartenden Lange 
mit starkem Signal in einem der kritischen Normalgewebe 
(Herz, Leber, Lunge, Niere und Leukozyten) , nicht jedoch 
in den cDNA-Bibliotheken aus immunprivilegierten Geweben 
(Gehirn, fotales Gehirn und Testis) unter diesen 

20 PCR-Bedingungen (1 Zyklus: 3' 94°C; 35 Zyklen: 1' 94°C - 
1' 55°C - 1' 72°C; 1 Zyklus: 7' 72°C) wurde als 
Ausscheidungskriterium definiert. Mittels dieser 
qualitativen PCR-Analyse konnte die Zahl der Kandidaten 
auf 56 eingeengt werden; Klon B345 befand sich in dieser 

25 bereits vorselektionierten Kandidatengruppe . 
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Beispiel 3 

Expressionsanalyse durch cDNA Chip Hybridisierung 

Fur das Design eines cDNA Chips wurden von der dBEST 
Datenbank uber Nukleotid-Sequenzsuche eine Reihe von 
5 Klonen ausgewahlt, die zu verschiedensten 

Funktionskategorien, wie Apoptose bis zur Zellzyklus- 
Regulation, gehSren. Ingesamt wurden 1299 IMAGE Klone 
(davon reprasentieren 1024 bereits bekannte Gene) 
bestellt und zur Kontrolle sequenziert. 

10 Mikrotiterplatten mit Bakterien, die ca. 800 bp lange 
Sequenzen vom 3"Ende des Gens im Vektor enthalten, 
wurden an Incyte Pharmaceuticals, Inc. (USA) geschickt 
und diese dort auf 60 Chips gespottet. Neben diesen 
Klonen wurden auch 120 durch RDA identif izierten EST 

15 Klone auf die Chips gespottet. Die so produzierten DNA 
Chips wurden anschlieliend mit Cy3 markierter cDNA aus 
Normalgewebe, Tumorgewebe und Zelllinien zusammen mit 
Cy5 markierter cDNA aus einer Mischung von neun 
verschiedenen Normalgeweben hybridisiert und die beiden 

20 Signale zur Normal isierung der Expressionswerte 

verglichen. Die Berechnungen erfolgten teilweise in 
S-Plus oder in Microsoft Excel. Die Auswertung der Chip 
Experimente ergab ein sehr ahnliches Expressionsprofil 
fur B345, B540 und B452 bei der Hybridisierung mit 

25 . Lungenkrebs Proben von Zelllinien und Pa'fcientenmaterial 
(Siehe Fig. 1A) . Solch ein tumorassoziiertes 
Expressionsprofil konnte fur B345 auch bei Vergleich von 
Kolon Adenokarcinom mit Kolon Normalgewebe gezeigt 
werden (Siehe Fig. IB) . 
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Das Sequenzalignment von B345, B540 und B452 zeigte 
eindeutig ein Oberlappen der einzelnen EST Fragmente. 
Daher konnte man annehmen, dass es sich bei den drei 
Klonen urn ESTs von ein und dem selben Gen handelt. Der 
5 daraus resultierende DNA Abschnitt deckt eine Lange von 
843 bp ab (Siehe Fig. 1C) und wurde in weiteren 
Versuchen zur Durchsuchung von offentlichen Datenbanken 
verwendet . Die Suchergebnisse lieferten keine 
signifikante Homologie zu bekannten DNA bzw. Protein 
10 Sequenzen, was darauf hindeutet, dass es sich bei B345 
urn ein bis lang unbekanntes Gen handelt. 

Beispiel 4 

Expressionsanalyse von B345 mittels Northern Blots 

15 Bei B345 handelt es sich um ein Gen, das laut DNA Chip 
Analysen in Tumorgeweben (siehe Fig. 1A und IB, Tab. la 
und Tab. IB) hochreguliert ist. 

Um einerseits das erhaltene Transkriptionsprof il zu 
bestatigen und andererseits die Lange der zu erwartenden 

20 mRNA fur die full size Klonierung zu bestimmen, wurde 
fur B345 eine Northern Blot Analyse unter Einsatz von 
humanen Zelllinien und des "Human Multiple Tissue 
Northern Blots" (Clontech und Invitrogen) durchgef uhrt . 
Als Sonden dienten die mit [a- 32 P]dCTP (NEN, Boston) 

25 markierten 490 bp bzw. 318bp langen PCR Produkte von 
B345 (Primer (SEQ ID NO: 5 und SEQ ID NO: 6 bzw. SEQ ID 
NO: 7 und SEQ ID NO: 8)) . Die Hybridisierung erfolgte bei 
68° fur 2 h; die Visual isierung durch Standard- 
Autoradiograf ie (Hyperfilm, Amersham) . Fig. 2A, 2B und 



WO 02/04508 



30 



PCT/EP01/07705 



2C sowie Tab. la und Tab. IB, 1C zeigen das Ergebnis 
dieser Analyse: Fig. 2A von der Zelllinie A549, Fig. 2B 
von 12 Normalgeweben (Periphere Blut Lymphozyten (PBL) , 
Lunge, Placenta, Diinndarm, Leber, Niere, Milz, Thymus, 
5 Kolon, Skelettmuskel, Herz und Hirn) und Fig. 2C von 
8 Krebszelllinien (Promyelozytische Leukamie HL60, 
HeLa-S3, chronische myelogene Leukamie K-562, 
lymphoblastische Leukamie MOLT-4, Burkitt's Lymphom 
(Raji), Kolon Adenokarzinom SW480, Lungen Adenokarzinom 
10 A549 und Melanom G361) . Das B345-Transkript zeigt eine 
Lange von 6,5 kb. 

Beispiel 5 

Analyse des Expressionsprof ils von B345 auf RNA-Ebene 
15 mittels quant i t at iver RT-PCR (real time PGR oder 
TaqMan- Analyse ) 

Urn eine exaktere Quant if izierung der mRNA Expression in 
den verschiedenen normal und Tumorgeweben durchzufiihren, 
wurde die "real time PCR" angewandt, die es erlaubt die 
20 RNA Konzentration im Vergleich zu einen externen 
Standard zu berechnen. 

Die Isolierung der RNA aus Gef riergewebe erfolgte mit 
Trizol gemali dem Herstellerprotokoll von Gibco. Zur 
Entfernung von etwaig kontaminierender DNA wurde die 
25 prSparierte RNA wie folgt mit DNAase I verdaut: 3 pg 
Gesamt-RNA wurden mit 20 pi 5x AMV Puffer (Promega) , 
1 pi RNasin (Promega) und 2 pi DNase I (Boehringer 
Mannheim) in einem Gesamtvolumen von 80 pi 15 Minuten 
bei 37 °C inkubiert. 120 pi Phenol : Chloroform : 
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Isoamylalkohol (25:24:1) wurden zugegeben, auf einem 
Vortexer gemischt und kurz abzentrifugiert . Die wassrige 
Phase wurde abgenommen, mit 120 pi Chloroform: 
Isoamylalkohol (24:1) versetzt und wie vorher 
5 zentrifugiert . Die gereinigte RNA wurde Ethanol-gef allt 
und in Wasser gel6st. 

Anschliefiend wurde die Gesamt-RNA mit reverser 
Transkriptase (Superscript, Gibco, BRL) in cDNA 
umgeschrieben: Zu 3 pg Gesamt-RNA wurden 1 pi Oligo dT 

10 primer (Promega) zugegeben und mit Wasser auf ein 

Endvolumen von 10 pi gebracht. Nach einer Inkubation von 
5 Minuten bei 70 °C wurde die Losung 5 Minuten bei 
Zimmertemperatur abgekuhlt. 5 pi RT reaction buffer (5x, 
Gibco, BRL), 2,5 pi dNTPs (je 10 mM, Boehringer 

15 Mannheim), 1 pi RNasin (lOU/pl, Promega), 1,5 pi 

Superscript (10 U/pl, Gibco, BRL) und 5 pi Wasser wurden 
zugegeben und 1 Stunde bei 42 °C inkubiert und die 
Reaktion durch Inkubation von 3 Minuten bei 95 °C 
beendet . 

20 Zur Herstellung eines cDNA-pools eines bestimmten Gewebe 
oder Tumortyps wurden 3 bis 10 verschiedene 
Einzelpraparationen von unterschiedlichen Patienten in 
gleichen Anteilen gemischt . 

Die quantitative Bestimmung der "Haushaltsgene" ft-Aktin, 
25 GAPDH und Tubulin in cDNA-pools wurde wie folgt 
durchgefiihrt : 

A) fl-Actin-TaqMan PCR (Perkin Elmer) 



Details uber das Prinzip der TaqMan Methode siehe 
Herstellerinf ormation (Perkin Elmer) . Ein TaqMan PCR 



WO 02/04508 



32 



PCT/EP01/07705 



Lauf beinhaltete Proben an fi-Actin-Kontrollsequenz mit 
je 10 2 , 10 3 , 10 4 , 10 s und 10* Kopien/pl (Perkin Elmer) zur 
Bestimmung der Standardkurve, eine Negativkontrolle ohne 
DNA und die zu quantif izierenden cDNA-pools. Alle Proben 
5 wurden in Triplikaten analysiert. F(ir einen 25 pi 

Reaktionsansatz wurden 1 pi cDNA, 2,5 pi lOx Puffer A 
(Perkin Elmer), 4 pi MgCl2 (25 mM, (Perkin Elmer) ) , 
0,5 pi je Nukleotid (10 mM dATP, dCTP, dGTP; 20 mM 
dUTP), 0,125 pi TaqMan Sonde (20 pM; TaqMan Sonde fur 
10 S-Aktin (SEQ ID NO: 20f luoreszenzmarkiert am 5'-Ende mit 
6-Carboxyfluorescein und mit 

6-Carboxytetramethylrhodamine am 3'-Ende), 1 pi je 
fl-Aktin spezifischer Primer (je 20 pM, Forward Primer 
SEQ ID NO:21 und Reverse Primer SEQ ID NO:22), 0,25 pi 

15 AmpErase uracil N-Glycosylase "UNG" (1 U/pl, Perkin 
Elmer), und 0,125 pi AmpliTaq Gold (5 U/pl, Perkin 
Elmer) gemischt, in MicroAmp Optical Tubes (Perkin 
Elmer) uberfuhrt und mit MicroAmp Optical Caps 
verschlossen. Die PCR wurde f olgendermafien durchgef uhrt : 

20 ein Zyklus mit 2 Minuten 50°C fur die UNG Reaktion, ein 
Zyklus 10 Minuten 95°C zur Aktivierung der AmpliTaq, 
40 Zyklen mit je 15 Sekunden 95° und 1 Minute 60 °C. 
Anschlieliend wurden die Proben auf 25 °C gehalten. Die 
Auswertung der Daten erfolgt mit dem Programm "Sequence 

25 Detection System 1.5bl" .(PE Applied Biosystems) , wobei 
im Prinzip die Fluoreszenzsignale der zu 
quantifizierenden cDNA-Proben mit den Signalen der 
Kontrollplasmidverdunnungen bekannter Konzentration 
verglichen wurden. 

30 B) GAPDH- TaqMan PCR 
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Fur die Quantif izierung von GAPDH, das wie JJ-Aktin oder 
Tubulin zur Normalisierung der eingesetzten RNAs 
verwendet wurde, sind folgende Primer bzw. Sonden 
eingesetzt worden. Als TaqMan Sonde fur GAPDH diente 
5 (SEQ ID NO: 23) eine am 5'-Ende mit 

Tetrachlorf luorescein und am 3'~Ende mit 
Carboxymethylrhodamin markierte Sonde (Forward GAPDH 
Primer: SEQ ID NO: 24 und Reverse Primer: SEQ ID NO: 25) . 
Die Reaktionen wurden wie oben beschrieben durchgef uhrt . 

10 C) Tubulin- SybrGreen PCR (Perkin Elmer) 

Prinzip der SybrGreen PCR siehe Herstellerinformation 
(Perkin Elmer) . Ein SybrGreen PCR Lauf beinhaltete 
Proben an Tubulin-Kontrollplasmid mit je 10 2 , 10 3 , 10 4 , 
10 5 und 10 6 Kopien/pl (Perkin. Elmer) zur Bestimmung der 

15 Standardkurve, eine Negativkontrolle ohne DNA und die zu 
quantif izierenden cDNA-pools. Alle Proben wurden in 
Triplikaten analysiert. Fur einen 25 pi Reaktionsansatz 
wurden 1 pi cDNA, 2,5 pi lOx SybrGreen Puffer (Perkin 
Elmer), 3,5 pi MgCl2 (25 mM, Perkin Elmer) ), 0,5 pi je 

20 Primer (je 20 pM, Perkin Elmer, Tubulin Forward (SEQ ID 
NO:26); Tubulin reverse (SEQ ID NO:27), 0,25 pi AmpErase 
uracil N-Glycosylase "UNG" (1 U/pl, Perkin Elmer), und 
0,25 pi AmpliTaq Gold (5 U/pl, Perkin Elmer) gemischt, 
in MicroAmp Optical Tubes (Perkin Elmer) uberfuhrt und 

25 mit MicroAmp Optical Caps Verschlossen. Die PCR wurde 
f olgendermaiien durchgef uhrt : ein Zyklus mit 2 Minuten 
50°C fur die UNG Reaktion, ein Zyklus 10 Minuten 95°C 
zur Aktivierung der AmpliTaq, 4 0 Zyklen mit je 15 
Sekunden 95° und 1 Minute 60°C. Anschlieliend wurden die 

30 Proben auf 25 °C gehalten. Die Auswertung der Daten 
erfolgt mit dem Programm "Sequence Detection System 



1.5bl" (PE Applied Biosystems) , wobei im Prinzip die 
Fluoreszenzsignale der zu quantif izierenden cDNA-Proben 
mit den Signalen der Kontrollplasmidverdunnungen 
bekannter Konzentration verglichen wurden. 

5 D) B345-TaqMan PCR 

Die quantitative TaqMan- PCR- Analyse von B345 wurde, wie 
fur die "Haushaltsgene" beschrieben, durchgefuhrt . Es 
wurden jedoch B345 spezifische Primer (SEQ ID NO:28 und 
SEQ ID NO: 29) (200 ng/pl) und eine B345 spezifische 

10 Sonde (SEQ ID N0:30, 20 pM) , die am 5'-Ende mit 
Tetrachlorf luorescein und am 3'-Ende mit 
Carboxymethylrhodamin markiert ist, verwendet. Als 
Standard wurde das PCR Produkt von B345 mit den Primern 
SEQ ID NO: 28 und SEQ ID NO: 29 mit bekannter Kopienzahl 

15 eingesetzt. 

Fig. 3 veranschaulicht die TaqMan- Expressionsanalyse 
(Fig. 3A: fl-Actin; Fig. 3B: Tubulin). Es zeigte sich, 
dass B345 hSher in Dickdarmkrebsgewebe als in 
Normalgewebe exprimiert ist (siehe Tab. 2a) . Nun stellt 

20 aber sowohl das Normalgewebe als auch das Tumorgewebe 

ein sehr heterogenes Gemisch von verschiedenen Zelltypen 
dar. Weiteres variiert der Anteil von Tumorzellen im 
Tumorgewebe sehr stark von etwa 30 bis 80%. Urn diese 
biologische Heterogenitat auf ein Minimum zu 

25 beschranken, wurden die Epithelzellen des Dickdarms, die 
die Ursprungszellen des Adenokarzinoms darstellen, und 
die Krebszellen oder Krebsareale durch Laser- 
Mikrodissektion spezifisch prapariert. Gewebeschnitte 
von 10pm Starke wurden mit dem Kyromikrotom von Leica, 

30 Jung CM1800 angefertigt und auf einen mit Polyethylen 
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beschichteten Objekttrager aufgebracht (Bohm et al., 
1997) . Die bei Raumtemperatur fur etwa 30 Minuten 
getrockneten Schnitte wurden mit Mayers Hematoxylin 
(SIGMA DIAGNOSTICS) inkubiert und anschlieliend zur 
5 Entfernung von unspezifisch gebundenen Farbstoff fiinf 
Minuten unter flieflendem Wasser gewaschen. Nach fiinf 
minutigem Trocknen bei 37 °C wurde die Laser- 
Mikrodissektion durchgef iihrt . Dafiir wurde das 
Lasermikroskop von PALM (PALM GmbH, Bernried, 

10 Deutschland) eingesetzt und etwa 2000 bis 5000 Zellen 
prapariert. Die durch Reverse Transkription gewonnene 
cDNA, wurde auch hier durch Real Time PCR analysiert. 
Das Ergebnis zeigt # dass die B345 Expression in 
Dickdarmkarzinom Zelllinien sowie in Patientenmaterial 

15 um ein Vielfaches hoher ist als vergleichsweise die des 
Dickdarmnormalgewebes . Zur Normal is ierung wurde der 
Expressionslevel von GAPDH bestimmt (siehe Fig. 4 und 
Tab. 2B) . 
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Beispiel 6 

a) Klonierung der cDNA von B345 

Das Durchsuchen von Datenbanken nach Sequenzen von 
Genfragmenten (ESTs, expressed sequence tags), die fur 
5 die „in silico* Klonierung von B345 herangezogen werden 
konnen, ergab ein uberlappendes EST-Kontig von etwa 
1500 bp. Der polyA-Bereich an einem. der Enden gab 
Hinweis auf die Orientierung des DNA Abschnittes in 
Bezug auf 5 ' - 3 1 Orientierung, was beim Design von 
10 neuen Primern fur die Amplifikation von B345- 
spezifischen cDNA-Fragmenten essentiell ist. 

Zunachst wurde das durch die Datenbankanalyse 
beschriebene potentielle 3 X Ende durch experimented 
Ansatze verifiziert. RNA von der Lungen-Karzinom 
15 Zelllinie Calu 6 (AACC No. HTB56) wurde mit Hilfe des 
Primers (SEQ ID NO: 9) revers transkribiert und die 
resultierende einzelstrangige cDNA wurde mittels PCR mit 
den Gen spezifischen Primer SEQ ID NO: 5 und den 
Adapterprimer SEQ ID NO: 10 amplifiziert. 

20 Fiir einen 25 pi PCR Ansatz wurden 1 pi des cDNA-pools 
mit 2,5 pi lOxTaq Puffer (Prpmega), 1,5 pi MgCl 2 (25 mM, 
Promega), 0,5 pi dNTPs (je 10 mM, Boehringer Mannheim), 
1 pi Primermischung (je 20 pM) , 0,15 pi Taq Polymerase 
(Promega) in Wasser gemischt. Die PCR wurde wie folgt 

25 durchgef iihrt : lx 94°C 3 Minuten; 30x 94°C 30 Sekunden, 
55°C 30 Sekunden, 72°C 1 Minute; auf 4°C halten. Die PCR 
wurde auf einem 1,2% Agarosegel analysiert. 

Die beiden Primer wurden anschlieliend zum Sequenzieren 
des gereinigten PCR Produktes verwendet. Die ermittelten 
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Sequenzen zeigten eine hohe Homologie mit dem "in 
silico" klonierten DNA Abschnitt (inklusive des PolyA- 
Trakts) . 

Da das Klonieren von 5 ' -Endsequenzen einen meist sehr 
5 aufwendigen Prozess darstellt, wurden im Folgenden zur 
Losung des Problems verschiedene Methoden angewandt. 

Als Ausgangszelllinie wurde auch hier Calu 6 verwendet. 
Nach der reversen Transkription der RNA mit dem Primer 
SEQ ID NO: 9 und der Zweitstrangsynthese wurde an die 

10 Doppelstrang-cDNA ein Linker bestehend aus den beiden 
Oligos SEQ ID NO: 11 und SEQ ID NO: 12 ligiert (Abe et 
al., 1992). Die daraus resultierende LoneLinker cDNA 
Bibliothek wurde dann mit dem Gen spezifischen Primer 
SEQ ID NO: 6 linear tiber 35 Zyklen amplif iziert . Ein 

15 Aliquot der B345 angereicherten cDNA konnte anschliefiend 
mit den Primern SEQ ID NO: 13 und LLEcoRIA SEQ ID NO: 11 
weiter amplif iziert werden. Nach der Gelelektrophorese 
eines Aliquots und Southernanalyse mit dem 
genspezif ischen Oligo SEQ ID NO: 14 konnte eine 5 kb 

20 Bande lokalisiert werden. In weiterer Folge wurde dieses 
Fragment schrittweise sequenziert und auf die Sequenz 
des EST-Kontigs ausgerichtet ("aligned"). 

Urn die resultierende Sequenz aus der LLcDNA Klonierung 
zu uberprufen, wurden zwei Fragmente mittels PCR (SEQ ID 

25 NO:15 und SEQ ID NO:16 bzw. SEQ ID NO:6 und SEQ ID 

NO: 17) amplifiziert und fur das Screenen von Lambda gtlO 
cDNA Phagen Bibliotheken eingesetzt. Positive Plaques 
wurden isoliert und mittels den gtlO spezifischen 
Primern (SEQ ID NO: 18 und SEQ ID NO: 19) PCR 

30 amplifiziert. Anschliefiende Sequenzierung und das 
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Alignment mit den Sequenzen fiihrte zu der Annahme, das 
es sich hierbei urn ein differenzielles Spleillprodukt 
handelt. Die SpleiBdonor, Akzeptor und Lariatsequenz 
konnten in weiterer Folge gefunden werden. Mittels PCR 
5 durch geeigneter Primerkombination wurde in 
verschiedenen Zelllinien nach dif ferenziellen 
Spleifiprodukten gesucht, wobei in alien gescreenten 
Zelllinien nur ein Produkt gefunden wurde und zu der in 
Fig. 5 dargestellten Genstruktur fiihrte. Die angefiihrte 

10 cDNA besitzt einen offenen Leserahmen (ORF) der fur ein 
potentielles Protein mit einer LSnge von 749 Aminosauren 
kodiert. Die Translationsinitiationsstelle an 
Position 215 entspricht zu etwa 75% einer Kozak- 
Konsensussequenz. Die in diesem Experiment erhaltenen 

15 Ergebnisse veranlassten dazu, in einem weiteren 
Experiment (Beispiel 6b) die 

Transkriptionsinitiationsstelle noch exakt durch Primer- 
Extension zu bestimmen, urn sicher zu gehen, dass das 
hier ermittelte 5' Ende das tatsachliche 5'-Ende von 
20 B345 ist. Die von der in diesem Klonierungsversuch 
erhaltenen cDNA (SEQ ID NO:l) abgeleitete 
Aminosauresequenz von B345 ist in SEQ ID NO: 2 gezeigt. 

b) Zweiter Klonierungsversuch; Bestimmung der S'-und 
der Promotorregion von B345 

25 Mit Hilfe des Promotor Finder DNA Walking Kit (Clontech)' 
und anschliefiender Primerextension Reaktion wurden die 
5' -Region und die Promotorregion sowie die exakte 
Transkriptionsinitiationsstelle bestimmt. Die 5--Region 
wurde mit Hilfe einer genomischen DNA Library von 

30 Clontech mit B345 spezifischen Primern (SEQ ID NO: 38 
bzw. nested SEQ ID NO: 39) und Adaptor Primer im Kit 
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amplif iziert . Um den exakten Transkriptionsstart zu 
bestimmen, wurde die Primer Extension Reaktion 
durchgefuhrt . Dafur wurde der Primer SEQ ID NO: 40 am 
5"-Ende mit Hilfe 10 U der T4 Polynukleotid Kinase 
5 (Promega) und 3pl [y- 32 P]ATP OOOOCi/mmol) nach Standard- 
Protokollen markiert (Sambrook et al . , 1989). Das 
markierte Oligonukleotid wurde durch PrSzipitation 
gereinigt. Fur die Primerextension Reaktion wurden 
10.000 cpm Oligonukleotid in einem Gesamtvolumen von 
10 20 pi zu 25 pg Total RNA der Colo 205 Zelllinie 
(ATCC:CCL-222) eingesetzt . 

Die RNA der Zelllinie wurde mit dem radioaktiv 
markiertem Primer revers transkribiert und auf ein 
10%- Polyacryamidgel aufgetragen. Zur Bestimmung der 

15 genauen Bandenlange wurde ein PCR Fragment von 
nt 1000 - nt 1362 mit 35 S markierten Nukleotiden 
sequenziert und "ebenfalls aufgetragen. Das aus der 
Elongation des reversen Primers resultierende Fragment 
von 209 Nukleotiden legt den Transkriptionsstart genau 

20 an Position 201 fest. Somit wurde die in Beispiel 6a 

erhaltene B345-Sequenz in der 5 "Region erweitert und ein 
neues Startkodon auf Position 283 bestimmt. Durch 
wiederholte Sequenzierungen auch in der 3 "Region wurde , 
im Vergleich zur in SEQ ID NO:l dargestellten Sequenz, 

* 

25. eine zusatzliche Base an Position 2430 gefunden, die zu 
einer Leserasterverschiebung fuhrt und somit das 
Stoppcodon von Position 2729 auf 2791 verschiebt . Die in 
diesem Versuch erhaltene cDNA (SEQ ID NO: 3) besitzt 
einen offenen Leserahmen, der fur ein potentielles 

30 Protein mit einer Lange von 836 Aminosauren (SEQ ID 
NO: 4) kodiert. 
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Beispiel 7 

Bioinformatik-Analyse zur Funktion von B345 

Die resultierende primare Aminosauresequenz von B345 ist 
5 in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz mit der Methode von Kyte und 
Doolittle (1982) zeigt, dass das B345 Protein zwei 
charakteristische hydrophobe Domanen aufweist 
(Aminosauren Pos. 1-29 und 666 - 691), die ein 

10 Signalpeptid und eine helikale Transmembrandomane 

darstellen (Fig. 6) . Diese polarisierte Struktur deutet 
darauf hin, dass es sich bei B345 um ein integrales 
Membraneprotein handelt. Die Transmembranhelix verbindet 
einen etwa 666 Aminosauren langen extrazellularen und 

15 einen kurzen (145 Aminosauren) intrazellularen Teil 
(siehe Fig. 7) . 

Die extrazellulare Domane weist aulierdem klare Indizien 
fur die Existenz einer CUB Domane bei Position 220 - 350 
sowie Indizien fur 2 mogliche weitere CUB Domanen im 

20 Bereich der Aminosauren 425 - 660 auf. CUB Domanen 
kommen bei verschiedenen, meist wahrend der 
Embryonalentwicklung regulierten Proteinen vor. AuBerdem 
sind manchmal bei EGF (Epidermal Growth 
Factor) -ahnlichen Domanen auch CUB Domanen anzutreffen. 

25 Eine kurzlich erschienene Publikation (Gerstein et al., 
2000) demonstriert, dafJ CUB Domanen enthaltende Proteine 
die am ausgepragtesten differenziell regulierten 
Proteine in C. elegans sind. Da Gene, die eine 
Schlusselrolle in der Embryonalentwicklung haben, auch 

30 analoge Funktionen in Krebs ausfuhren, kann angenommen 
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werden, dass eine Oberexpression von B345 in Zellen eine 
Veranderung in den Eigenschaf ten der Substratadhasion 
oder der extrazellularen Matrix bewirkt. Das Protein 
weist aulierdem 12 potentielle N- Glycosylierungsstellen 
5 auf, die in der vorhergesagten extrazellularen Domane zu 
finden sind, was mit der vorhergesagten Orientierung des 
Proteins ubereinstimmt . 

Mit einem BLAST hit (E-value: 5.8 x 10" 2 ) fur den Bereich 
der Aminosauren von 235 bis 282 von B345 konnte eine 
10 Kompleraent aktivierende Komponente des £A-reactive . - 
factor (RARF) aus mus musculus identif iziert werden. Das 
Alignment befindet sich innerhalb der CUB Domane 1 von 
B345. 

Die CUB-Domanen 2 and 3 (Bereich 425-535 und 545-660) 
15 weisen marginale Homologien zu dem humanen und Fugu 

Prokollagen C-Proteinase Enhancer Protein (PCOLCE) auf . 
Diese Regionen kommen in dem Bereich von PCOLCE vor, 
welcher ein CUB Domanen Tandem Repeat enthalt (E-values: 
0.5 (human) und 2.7 (Fugu)). CUB Domanen kommen manchmal 
20 in Repeats vor. 

Vermutlich bildet das B345-Protein eine fl-Sheet 
Sekundarstruktur f da sich CUB Domanen bekanntlich als 
J5-Sandwich falten. 

Die intrazellulare Domane (Bereich 691-836) weist keine 
25 signif ikanten Homologien auf. Der gesamte C-Terminus 
aligned jedoch mit einem EST (AW063026) von humanen 
Eierstockkrebs Zellen (82% Identitat uber 
124 Aminosauren) . 



f 
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Beispiel 8 

Bestimmung der genauen Genstruktur von B345 

Zunachst wurden Bac Klone in bffentlichen Datenbanken 
(BLAST search) gesucht, die das B345-Gen enthalten. Die 
5 Bac Klone Ac068625 und Ac010170 enthielten einen 

Groflteil des Gens. Mit intronspannenden Primern wurden 
Spliceakzeptor und Donorsequenzen in Colo 205 cDNA und 
genomischer DNA als Template gesucht. Das PCR Protokoll 
wurde wie folgt durchgef iihrt : lx 95°C 2 Minuten, 

10 35x 95°C 15 Sekunden, 68 °C 3 Minuten und dann auf 4°C 
gehalten. Die PCR wurde auf einem 1,2% Agarosegel 
analysiert und dabei die Langen der PCR Produkte der 
2 Templates mit gleichen Primerkombinationen verglichen. 
Es stellte sich heraus, dass B345 aus 8 Exons, getrennt 

15 von 7 Introns besteht (Fig. 5) . 

Die chromosomale Lokalisation des Gens wurde mittels 
Fluoreszenz-in situ-Hybridisierung (FISH) bestimmt. 
Dabei wurde die humane, Digoxigenin-markierte B345 Sonde 
zusammen mit der Biotin-markierten Sonde von B47a2 

20 (Knight et al., 1997), welche sich auf der sub- 

telomerischen Region des Chromosomenarms 3p befindet, 
mit Metaphase-Chromosomen zweier "normaler" Individuen 
hybridisiert (Lichter et al., 1988). Die hybridisierte 
Digoxygenin- Sonde wurde mittels Anti-Schaf -Dig 

25 (Boehringer Mannheim FRG) und Kaninchen Anti-Schaf FITC- 
markierten AntikSrpern detektiert. Die Biotin markierte 
Probe dagegen wurde mit Maus Anti-Biotin und Kaninchen- 
Anti-Maus (TRITC) und anschlieJJende Farbung mit DAPI 
sichtbar gemacht. Die FISH Resultate zeigen, dass eine 

30 Mehrheit der Metaphasen eindeutige Signale an einem oder 
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beiden Chromatiden des Chromosoms 3 in der Region 
p21-p23 haben. Als Bestatigung der Position diente die 
Co-lokalisation der B47a2 (TRITC) -Sonde auf dem selben 
chromosomalen Arm. 
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Tab.lA 





Jill 


DDI 

rbL 




Lunge 


++ 


rlazenta 


+ 


r\f* 1 , — 

uunndarm 


+ 


Leber 




Niere 


++ 


MHZ 




"hvmus 




Kolon 


+ 


Skelettmuskel 




Herz 




Him 
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Tab . IB 







promyeiocynscne LGUKamie nuou 




ntLA zenen oo 




Lrnroniscne Myeiogene LeuKamie r\-boZ 


+ 






BurkitTs Lymphom (Raji) 




Kolon Adenokarzinom SW480 


+++ 


Lungen Adenokarzinom A549 


+ 


Melanom G361 
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Tab.lC 





EXonsssuDrii 


Speiserohre Tumor 


(+) 


Speiserdhre Normal 


(+) 


Magen Tumor 


- 


Magen Normal 


+ 


Kolon Tumor 


+++ 


Kolon Normal 


++ 


Mastdarm Tumor 


+ 


Mastdarm Normal 


( + ) 
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Tab . 2A 







ill 


■IfiillSil 


Lunge Adenokarzinom 


+ 


+ 


Lunge Adenokarzinom 


+ 


+ 


Lunge Normal 


- bis (+) 


(+) 


Kolon Adenokarzinom 


++ 


++ 


Kolon Adenokarzinom 


+++ 


+++ 


Kolon Normal 


- bis (+) 


+ 


Mamma IDC 


+ 


+ 


Brust 






Hodgkin's Lymphom 






Milz 






Testis 
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Tab.2B 







Kolon Adenokarzinom SW480 


+ 


Kolon Normal (Clonetech) 


( + ) 


Kolon Normal (Invitrogen) 


( + ) 


Lungen Adenokarzinom A549 


( + ) 


Kolon Adenokarzinom Colo 205 


+++ 


PG 102142 Tumor (Colon Ac.) 


+++ 


PG 21900 Tumor (Colon Ac.) 


++ 


PG 7066 Tumor (Colon Ac.) 


f++ 


PG 32389 Tumor (Colon Ac.) 


f+ 
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PatentansprUche 



10 



15 



20 5. 



25 6. 



Tumorassoziiertes Antigen der Bezeichnung B345, 
dadurch gekennzeichnet, dass es die in SEQ ID NO: 4 
definierte Aminosauresequenz aufweist oder diese 
als Teilsequenz enthalt, oder ein Fragment davon. 

Isoliertes DNA-Molekul, kodierend fur das in 
Anspruch 1 definierte tumorassoziierte Antigen 
oder fur Fragmente davon. 

DNA-Molekul nach Anspruch 2, dadurch 
gekennzeichnet, dass es ein Polynukleotid mit der 
in SEQ ID NO: 3 dargestellten Sequenz ist oder 
diese Sequenz enthalt oder dass es ein 
Polynukleotid ist oder dieses enthalt, das mit 
einem Polynukleotid der in SEQ ID NO: 3 
dargestellten Sequenz unter stringenten 
Bedingungen hybridisiert, oder ein Fragment davon. 

Rekombinantes DNA-Molekul, enthaltend ein 
DNA-Molekul gemaB Anspruch 2 oder 3. 

Pharmazeutische Zusammensetzung fur die 
Immuntherapie von Krebs, enthaltend als wirksame 
Komponente das in Anspruch 1 definierte 
tumorassoziierte Antigen der Bezeichnung B345 oder 
ein oder mehrere Fragmente davon. 

Pharmazeutische Zusammensetzung fur die 
Immuntherapie von Krebs, enthaltend als wirksame 
Komponente ein DNA-Molekul gemaii einem der 
Anspruche 2 bis 4. 
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55 

7. Antikorper gegen das in in Anspruch 1 definierte 
Polypeptid. 

8. Antikorper nach Anspruch 7, dadurch 
gekennzeichnet , dass er monoklonal ist. 

5 9. Antikorper nach Anspruch 7 oder 8 fur die Therapie 
und Diagnose von Krebserkrankungen, die mit der 
Expression von B345 assoziiert sind. 
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Fig. 1B 
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Fig. 1C 
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Fig. 2A 
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Fig. 2B 
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Fig. 2C 
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Fig. 3a 



<: 

in 

CO 
CO 



X 



I 



% 



oooooooo >/{ 
p o o o o o o 

N CD lO ^ CO CN) r 



'<3 



> 



WO 02/04508 



PCT/EP01/07705 



8/12 

Fig. 3b 
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Fig. 4 
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Fig. 6 
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Fig.7 
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SEQUENZ PROTOKOLL 
<110> Boehringer Ingelheim International GmbH 
<120> Tumorexprimiertes Polypeptid B34-5 
<130> case 12_214,219 

<140> 
<141> 

<160> 40 

<170> Patentln Ver. 2.1 



<210> l 

<211> 5897 

<212> DNA 

<213> Homo sapiens 

<220> 

<221> 5'UTR 
<222> (1)..(214) 

<220> 
<221> CDS 

<222> (215) . . (2464) 
<220> 

<221> 3'UTR 



<222> (2465) . . (5897) 
<400> 1 

cttgagatat tagaattcgc gactcctgaa ctgcggggtc tctatcgcac tgctaggggt 60 

tctgctgctg ggtgcggcgc gcctgccgcg cggggcagaa gcttttgaga ttgctctgcc 120 

acgagaaagc aacattacag ttctcataaa gctggggacc ccgactctgc tggcaaaacc 180 

ctgttacatc gtcatttcta aaagacatat aacc atg ttg tec ate aag tot gga 235 

Met Leu Ser He Lys Ser Gly 



E5£S££££5:aS2H£2£ - 

15 20 

S 2 a £ = £ £ £ % * st £ S 5 5 - « 

30 35 

ttt ggg gag gtt cag ctt cag ccc tea aca i- m ^ 
P*e G l y ozu va! Gl n «! P„ Se =? £ g £ £ S S £ 
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aac aga act ttc ate tgg gat gtc aaa get cat aag age ate ggt tta 427 

Asn Arg Thr Phe lie Trp Asp Val Lys Ala His Lys Ser lie Gly Leu 
60 65 70 

gag ctg cag ttt tec ate cct cgc ctg agg cag ate ggt ccg ggt gag 475 

Glu Leu Gin Phe Ser lie Pro Arg Leu Arg Gin lie Gly Pro Gly Glu 
75 80 85 

age tgc cca gac gga gtc act cac tec ate age ggc cga ate gat gee 523 

Ser Cys Pro Asp Gly Val Thr His Ser lie Ser Gly Arg lie Asp Ala 
90 95 100 

acc gtg gtc agg ate gga ace ttc tgc age aat ggc act gtg tec egg 571 

Thr Val Val Arg lie Gly Thr Phe Cys Ser Asn Gly Thr Val Ser Arg 
105 110 115 

ate aag atg caa gaa gga gtg aaa atg gee tta cac etc cca tgg ttc 619 

lie Lys Met Gin Glu Gly Val Lys Met Ala Leu His Leu Pro Trp Phe 
120 125 130 135 

cac ccc aga aat gtc tec ggc ttc age att gca aac cgc tea tct ata 667 

His Pro Arg Asn Val Ser Gly Phe Ser lie Ala Asn Arg Ser Ser He 
140 145 150 

aaa cgt ctg tgc ate ate gag tct gtg ttt gag ggt gaa ggc tea gca 715 

Lys Arg Leu Cys He He Glu Ser Val Phe Glu Gly Glu Gly Ser Ala 
155 160 165 

acc ctg atg tct gee aac tac cca gaa ggc ttc cct gag gat gag etc 763 

Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe Pro Glu Asp Glu Leu 

170 175 180 

atg acg tgg cag ttt gtc gtt cct gca cac ctg egg gee age gtc tec 811 

Met Thr Trp Gin Phe Val Val Pro Ala His Leu Arg Ala Ser Val Ser 
185 190 195 

ttc etc aac ttc aac etc tec aac tgt gag agg aag gag gag egg gtt 859 

Phe Leu Asn Phe Asn Leu Ser Asn Cys Glu Arg Lys Glu Glu Arg Val 
200 205 210 215 

gaa tac tac ate ccg ggc tec acc acc aac ccc gag gtg ttc aag ctg 907 
Glu Tyr Tyr He Pro Gly Ser Thr Thr Asn Pro Glu Val Phe Lys Leu 
220 . . 225 230 

gag gac aag cag cct ggg aac atg gcg ggg aac ttc aac etc tct ctg 955 
Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn Phe Asn Leu Ser Leu 
235 240 245 

caa ggc tgt gac caa gat gee caa agt cca ggg ate etc egg ctg cag 1003 
Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly He Leu Arg Leu Gin 

250 255 260 

ttc caa gtt ttg gtc caa cat cca caa aat gaa age aat aaa ate tac 1051 

Phe Gin Val Leu Val Gin His Pro Gin Asn Glu Ser Asn Lys He Tyr 
265 270 275 



WO 02/04508 



PCT/EP01/07705 



3 



£? £f f C t" 9 39t 9a9 Cga gCC atg tca ctc acc ate gag cca 1099 
Va Val Asp Leu Ser Asn Glu Arg Ala Met Ser Leu Thr He Glu Pro 

285 290 295 

egg ccc gtc aaa cag age cgc aag ttt gtc cct ggc tgt ttc ata tat ii« 
Arg Pro Val Lys Gin Ser Arg Lys Phe Val Pro Sy <£ £ Vaf Cys 1147 
300 305 31Q 



l!u n c *" T tgC agt agC aac ctc acc ct 9 aca tct ggc tec 
Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr Leu Thr Ser Sy Ser 

315 320 325 

aaa cac aaa ate tec ttc ctt tgt gat gat ctg aca cgt ctq too ata 
Lys Hxs Lys lie Ser Phe Leu Cys Asp Asp Leu Thr Arg Leu g Mel 
JJ0 335 340 

A^n £? ?r !u C agC t9C aca gac cac c 99 tac tgc caa agg 
Asn Val Glu Lys Thr lie Ser Cys Thr Asp His Arg Tyr C^s Gin S 
4b 350 355 

aaa tec tac tca ctc cag gtg ccc agt gac ate ctc cac ctq cct ata 
Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp lie Leu His Leu Pro Val 
• 365 370 375 

gag ctg cat gac ttc tec tgg aag ctg ctg gtg ccc aag gac agg ctc 
Glu Leu Hxs Asp Phe Ser Trp Lys Leu Leu Val Pro Lys Asp JE Leu 
380 385 390 

Ser 52 £? T t9 f ? CCa 9CC Cag 339 Ctg cag ca 9 cat a ca cac gag 
Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin Gin His Thr His Glu 

395 400 405 

aag, ccc tgc aac acc age ttc age tac ctc gtg gee agt gee ata cor 
Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val Ala Ser Ala £ Pro 
0 41 5 420 

Ser Gin ? & n f* ?° 9 ?° tCC ttC tgc Ccg & a ^ ** ate aag 
Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro Gly Gly Ser lie J s 

^ 5 430 435 

?f! f ? 339 039 3aC atC tcg gt 9 acc ctt C 9 C acc ttt gee 
Gin lie Gin Val Lys Gin Asn lie Ser Val Thr Leu Arg Thr Phe £a 

445 450 4 55 

Pro sir Phe Sn Gin 5* f *" Ca ' 9 9gt Ctg acg gtg tcc ttt 
Pro ser Phe Gin Gin Glu Ala Ser Arg Gin Gly Leu Thr Val Ser Phe 

460 465 470 

ata cct tat ttc aaa gag gaa ggc gtt ttc acg gtg acc cct gac aca 
He Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr Val Thr Pro Sp J£ 
475 480 4 8 5 

aaa age aag gtc tac ctg agg acc ccc aac tgg gac egg ggc ctq cca 
Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp Asp Arg" lly Leu Pro 
490 495 500 



1195 



1243 



1291 



1339 



1387 



1435 



1483 



1531 



1579 



1627 



1675 



1723 
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tec etc acc tct gtg tec tgg aac ate age gtg ccc aga gac cag gtg 1771 
Ser Leu Thr Ser Val Ser Trp Asn lie Ser Val Pro Arg Asp Gin Val 
505 510 515 

gee tgc ctg act ttc ttt aag gag egg age ggc gtg gtc tgc cag aca 1819 
Ala Cys Leu Thr Phe Phe Lys Glu Arg Ser Gly Val Val Cys Gin Thr 
520 525 530 535 

ggg cgc gca ttc atg ate ate cag gag cag egg acc egg get gag gag 18 67 
Gly Arg Ala Phe Met lie lie Gin Glu Gin Arg Thr Arg Ala Glu Glu 
540 545 550 

ate ttc age ctg gac gag gat gtg etc ccc aag cca age ttc cac cat 1915 
lie Phe Ser Leu Asp Glu Asp Val Leu Pro Lys Pro Ser Phe His His 
555 560 565 

cac age ttc tgg gtc aac ate tct aac tgc age ccc acg age ggc aag 1963 
His Ser Phe Trp Val Asn lie Ser Asn Cys Ser Pro Thr Ser Gly Lys 
570 575 580 

cag eta gac ctg etc ttc teg gtg aca ctt acc cca agg act gtg gac 2011 
Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr Pro Arg Thr Val Asp 
585 590 595 

ttg act gtc ate etc ate gca gcg gtg gga ggt gga gtc tta ctg ctg 2 059 
Leu Thr Val He Leu He Ala Ala Val Gly Gly Gly Val Leu Leu Leu 
600 605 610 615 

tct gee etc ggg etc ate att tgc tgt gtg aaa aag aag aaa aag aag 2107 
Ser Ala Leu Gly Leu He He Cys Cys Val Lys Lys Lys Lys Lys Lys 
620 625 630 

aca aac aag ggc ccc get gtg ggt ate tac aat ggc aac ate aat act 2155 
Thr Asn Lys Gly Pro Ala Val Gly He Tyr Asn Gly Asn He Asn Thr 
635 640 645 

gag atg cca ggc age caa aaa agt ttc aga aag ggc gaa agg aca atg 22 03 
Glu Met Pro Gly Ser Gin Lys Ser Phe Arg Lys Gly Glu Arg Thr Met 
650 655 660 

act ccc atg tgt atg cag tea teg agg aca cca tgg tat atg ggc ate 2251 
Thr Pro Met Cys Met Gin Ser Ser Arg Thr Pro Trp Tyr Met Gly He 
665 670 675 - . . 

tgc tac agg att cca gcg get cct tec tgc age cag agg tgg aca cct 2299 
Cys Tyr Arg He Pro Ala Ala Pro Ser Cys Ser Gin Arg Trp Thr Pro 
680 685 690 695 

acc ggc cgt tec agg gca cca tgg ggg tct gtc etc cct ccc cac cca 2347 
Thr Gly Arg Ser Arg Ala Pro Trp Gly Ser Val Leu Pro Pro His Pro 
700 705 710 

cca tat get cca ggg ccc caa ctg caa agt tgg cca ctg agg age cac 2395 
Pro Tyr Ala Pro Gly Pro Gin Leu Gin Ser Trp Pro Leu Arg Ser His 
715 720 725 
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etc etc get ccc etc ctg agt ctg aga gtg aac cgt aca cct tct ccc 2443 
Leu Leu Ala Pro Leu Leu Ser Leu Arg Val Asn Arg Thr Pro Ser Pro 
730 735 7 4 o 

ate cca aca atg ggg atg taa gcagcaagga cacagacatt cccttactga 2494 
He Pro Thr Met Gly Met 

745 " 750 

acactcagga geccatggag ccagcagaat aacttgatcc attccagacg etttgetgag 2554 
tttcataaag cagggcactg agaeacccgt ccgtgttcct aaccagaaat cctaaagaag 2614 
aggaattata cagaaggaac agcaggaggt tttcctggac accgccaact teacattget 2674 
cagtggactc attctaaggg caagacattg aaaatgatga attccaatct ggatacagtc 2734 
atgaeagctc atgtgctcct caacttaggc tgtgcggtta gccagcctgt aatgagagga 2794 
gagaggectg agtcacctag catagggttg cagcaagccc tggattcaga gtgttaaaca 2854 
gaggcttgee ctcttcagga caacagttcc aattccaagg agcctacctg aggtccctac 2914 
tctcactggg gtccccagga tgaaaacgac aatgtgcctt tttattatta tttatttggt 2974 
ggtcctgtgt tatttaagag atcaaatgta taaccaccta gctcttttca cctgacttag 3034 
taataactca tactaactgg tttggatgcc tgggttgtga cttctactga cegctagata 3094 
aacgtgtgcc tgtcccccag gtggtgggaa taatttacaa tctgtccaac cagaaaagaa 3154 
tgtgtgtgtt tgagcagcat tgacacatat ctgetttgat aagagacttc ctgattctct 3214 
aggteggtte gtggttatcc cattgtggaa attcatcttg aatcccattg tcctatagtc 3274 
ctagcaataa gagaaatttc ctcaagtttc catgtgcggt tctcctagct gcagcaatac 3334 
tttgacattt aaagagaaat ttagagaata ttctcatcct ctaaaaatgt ttaaatatat 3394 
accaaacagt ggccccctgc attagttttc tgttgccact gcaacccatt acttggtagc 3454 
ttaaaaacaa cacattagct tatagtcctg gggatcagaa ttccaaaatg gatgtccctg 3514 
aatgaaaatc aaggtgtcag cagagctgtg ctccttctga aggctctagg gagaagcegg 3574 
ttccttgcca tttcaagctt ctagaggctg gctgcattcc caggctccag tggctggtca 3634 
agcttttctc acatggcatc actgtgacac tggccctccc acttccctct ttgacttaca 3694 
aagcccacca ggaagatcca ggataatctc tccatctaaa gatccttcat catcctggaa 3754 
gagecttttg ecatgeaaga caacatagcc acaggtgggg attaggacca ggacatcttt 3814 
ggggtgctgt tattctgect accacacctt cctgccacbg actcccacag gagaggctac 3874 
aaaatgatct ggegcacagg gatgttttgt ttagcttgcg gactctaaca cttaaaaaaa 3934 
ccccagatca gaagatctgg ccatgctggg gctcacattc tcacctagca acaactggct 3994 
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ggagctgggc 


accagctctg 


cctttagaag 


gggtgtccac 


ttcaccaggt 


caccacagcc 


4054 


cacactacgc 


cctatcactt 


cccacaatga 


ggctaagtgt 


ttgtttctac 


tgatcaatgc 


4114 


ccctgcaggt 


tgcatttatt 


gtaatgaaaa 


agaaagactg 


ggattaatct 


ctaatcaggt 


4174 


gagtagacca 


tgagaccaat 


gtgtgctcac 


attacccttt 


ttcttttttt 


tctttttctt 


4234 


tttctttttt 


tttttaatgt 


gagacaggat 


ctcattctgt 


tgcctaggct 


ggagtgcagt 


4294 


ggcgcaatct 


cggctcactg 


caacctctgc 


ctcctgggct 


caagcaattc 


tcccacctca 


4354 


gcctcccaaa 


tagctgggat 


cactggcaca 


aaccaccatg 


cccagctaat 


tttgtatttt 


4414 


ttgtagagac 


agggtttcac 


catgttgccc 


aggctggtct 


caacctcctg 


ggctcaagca 


4474 


atcctcctgc 


ctcggcctcc 


caaagtgctg 


ggattacaga 


tgtgagccac 


cgcatccagc 


4534 


cccacaccct 


catttatacc 


aattacctgc 


ccagtaactg 


tggacttttg 


cttcctcacc 


4594 


cctgctctga 


tctggaagga 


gagggattat 


gttatagctt 


gtcagcacag 


tcccaagttc 


4654 


aatatttctg 


cggcaaaaac 


ttccttcaaa 


aaataaatgt 


acttcattgt 


attcaatgaa 


4714 


ttcaccttgg 


aaatgcaccg 


cctcaacttg 


ttcacatggc 


ataaatgaaa 


ggaattttat 


4774 


agtctcctaa 


atggcgtgta 


ctgcaagacc 


tcttgaacac 


tttccagagg 


ataggatatt 


4834 


taagtcatgc 


ccttggcgtt 


gcctatggca 


cctttccctt 


ctgaaagtct 


ggttcctgcc 


4894 


cagtgaccct 


tggccttgtg 


agccgagatg 


ctgaccctgc 


ataaagggcc 


aaaggagggc 


4954 


tgcggcttcc 


ttccctcact 


gaagagccct 


tatttgaatt 


cactgtgtgg 


agccctagcc 


5014 


ctccattctc 


gacattcccc 


aacctcccag 


ccccttccaa 


gcaggactag 


gtgccctgca 


5074 


ttccacccaa 


ggtgggattg 


gccttcctta 


ggctggctac 


ttgtcaccat 


caccgacatc 


5134 


actgttgcct 


gcaaggacac 


cacgtggcca 


ttttccttca 


actgagggct 


caaaactcct 


5194 


ggacaagttg 


ctggctcctg 


agaccagtat 


ttcctggagm 


tgtgcctcag 


tgaaggggcc 


5254 


cagcctgagg 


aaccctggct 


cttttcttta 


aagcccaggc 


cccacttaca 


taaaacattt 


5314 


cagggtcact 


ggaaacagtg 


aagtgccatt 


tgtngaagcc 


tactgnatgc 


cagcccactg 


5374 


ctcatccacg 


tggtatgcca 


tgcctacgag 


gaagg'ccagc 


gcatgcagga 


ntggtctcta 


5434 


atgntgtggt 


cattgcacag 


aagggaaagg 


tctcaaggaa 


gagtcaactg 


ggacaagcac 


5494 


aagcccaccg 


gacatggcct 


tggtaaaggt 


tagcagactg 


gtgtgtgtgg 


atctgcagtg 


5554 


cttcactgga 


aataatttat 


tcattgcaga 


tactttttag 


gtggcatttt 


attcatttcc 


5614 


tgtgctttaa 


ataaacaaat 


gtaccaaaaa 


acaagtatca 


agctgtttaa 


gtgcttcggc 


5674 


tacttgtccc 


ctggttcagt 


agaggccccg 


gtttcccagt 


tgttgactgt 


gacaggctca 


5734 
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gcatgggctc agcagatgct gtcttaattt gtggatgata cagaaagcca ggctttggga 
tacaagttct ttcctcttca tttgatgccg tgcactgtgt gaagcagatg tttttgtccg 
gaaataaaaa taatagtctt ggagtctcgc caaaaaaaaa aag 



<210> 2 

<211> 749 

<212> PRT 

<213> Homo sapiens 



Met Leu Ser lie Lys Ser Gly Glu Arg He Val Phe Thr Phe Ser Cys 



<400> 2 

Ser lie Lys Ser Gly Glu Arg : 

5 ~ 10 15 

Gin Ser Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn lie Asp 
20 25 ' 30 

Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser 
35 40 45 

Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys 

55 60 

Ala His Lys Ser He Gly Leu Glu Leu Gin Phe Ser He Pro Arg Leu 
65 70 75 80 

Arg Gin He Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr His Ser 



85 



90 



95 



He Ser Gly Arg He Asp Ala Thr Val Val Arg lie Gly Thr Phe Cvs 
100 105 110 

Ser Asn Gly Thr Val Ser Arg He Lys Met Gin Glu Gly Val Lys Met 
115 W0 125 

Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser 

135 140 

lie Ala Asn Arg Ser Ser He Lys Arg Leu Cys lie He Glu Ser Val 



145 150 155 



160 



Phe Glu Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu 

iss 170 175 

Gly Phe Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val 



180 185 



Pro Ala 



190 



His Leu Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn Cys 
195 200 20S 

Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr He Pro Gly Ser Thr Thr 

215 . 220 

Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala 
230 2 35 240 



5794 
5854 
5897 
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Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser 
245 250 255 

Pro Gly lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin 
260 265 270 

Asn Glu Ser Asn Lys lie Tyr Val Val Asp Leu Ser Asn Glu Arg Ala 
275 280 285 

Met Ser Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe 
290 295 300 

Val Pro Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn 
305 310 315 320 

Leu Thr Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu Cys Asp 
325 330 335 

Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser Cys Thr 
340 345 350 

Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser 
355 360 365 

Asp lie Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu 
370 375 380 

Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys 
385 390 395 400 

Leu Gin Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr 
405 410 415 

Leu Val Ala Ser Ala lie Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe 
420 425 430 

Cys Pro Gly Gly Ser He Lys Gin He Gin Val Lys Gin Asn He Ser 
435 440 445 

Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg 
450 455 460 

Gin Gly Leu Thr Val Ser Phe He Pro Tyr Phe Lys Glu Glu Gly Val 
465 470 475 480 

Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro 
485 490 495 

Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn He 
500 505 510 

Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu Arg 
515 520 525 



Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met He He Gin Glu 
530 535 540 
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Gin Arg Thr Arg Ala Glu Glu He Phe Ser Leu Asp Glu Asp Val 



545 550 



Leu 

555 560 



Pro Lys Pro Ser Phe His His His Ser Phe Trp Val Asn lie Ser Asn 
565 570 575 

Cys Ser Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser Val Thr 
590 5 8 5 590 

Leu Thr Pro Arg Thr Val Asp Leu Thr Val lie Leu lie Ala Ala Val 
595 600 6 05 

Gly Gly Gly Val Leu Leu Leu Ser Ala Leu Gly Leu He He Cys Cvs 
610 615 620 

Val Lys Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val Gly He 
625 630 635 640 

Tyr Asn Gly Asn He Asn Thr Glu Met Pro Gly Ser Gin Lys Ser Phe 
645 650 655 

Arg Lys Gly Glu Arg Thr Met Thr Pro Met Cys Met Gin Ser Ser Arg 
560 665 670 

Thr Pro Trp Tyr Met Gly He Cys Tyr Arg He Pro Ala Ala Pro Ser 
675 680 685 

Cys Ser Gin Arg Trp Thr Pro Thr Gly Arg Ser Arg Ala Pro Trp Gly 
690 695 700 

Ser Val Leu Pro Pro His Pro Pro Tyr Ala Pro Gly Pro Gin Leu Gin 
705 710 715 720 

Ser Trp Pro Leu Arg Ser His Leu Leu Ala Pro Leu Leu Ser Leu Arq 
725 730 735 

Val Asn Arg Thr Pro Ser Pro He Pro Thr Met Gly Met 
740 745 



<210> 3 
<2H> 6163 
<212> DNA 

<213> Homo sapiens 
<220> 

<221> 5'UTR 
<222> (1) . . (282) 

<220> 

<221> GC_signal 
<222> (147) . . (157) 

<220> 

<221> misc_feature 
<222> (201) . . (209) 

<223> cap signal; Transkriptionsstart 
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<220> 

<221> 3'UTR 

<222> (2794) (6163) 

<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 
<400> 3 

ccaacgccgc aatggggagt agtagggacc cagcaacccg gtgccgggag ccctgcaccc 60 

tgggagggag aggcggtcgc tgaggcagga agaggaggag gagagagagg agggacgcac 12 0 

cgggtcagct cgcgatcctg ctgcgcaggg cggggctcgg gccggtccgc ccgcgcgcag 180 

gtgagtgagc cagggcggag cgcagctgcg ccgggcttgg gcgcctgggg ccgccgctcc 240 

ccaccgtcgt tttccccacc gaggccgagg cgtcccggag tc atg gcc ggc ctg 294 

Met Ala Gly Leu 
1 

aac tgc ggg gtc tct ate gca ctg eta ggg gtt ctg ctg ctg ggt gcg 342 
Asn Cys Gly Val Ser lie Ala Leu Leu Gly Val Leu Leu Leu Gly Ala 
5 10 15 20 

gcg cgc ctg ccg cgc ggg gca gaa get ttt gag att get ctg cca cga 390 
Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu lie Ala Leu Pro Arg 
25 30 35 

gaa age aac att aca gtt etc ata aag ctg ggg ace ccg act ctg ctg 43 8 
Glu Ser Asn lie Thr Val Leu lie Lys Leu Gly Thr Pro Thr Leu Leu 
40 45 50 

gca aaa ccc tgt tac ate gtc att tct aaa aga cat ata ace atg ttg 486 
Ala Lys Pro Cys Tyr lie Val lie Ser Lys Arg His lie Thr Met Leu 
55 60 65 

tec ate aag tct gga gaa aga ata gtc ttt ace ttt age tgc cag agt 534 
Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe Ser Cys Gin Ser 
70 75 80 

cct gag aat cac ttt gtc ata gag ate cag aaa aat att gac tgt atg 582 
Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn lie Asp Cys Met 
85 90 95 100 

tea ggc cca tgt cct ttt ggg gag gtt cag ctt cag ccc teg aca teg 630 
Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser Thr Ser 
105 110 115 

ttg ttg cct ace etc aac aga act ttc ate tgg gat gtc aaa get cat 678 
Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys Ala His 
120 125 130 



WO 02/04508 



PCT/EP01/07705 



11 



aag age ate ggt tta gag ctg cag ttt tec ate cct cgc ctg agg caq 726 
Lys Ser He Gly Leu Glu Leu Gin Phe Ser He Pro A?g Leu Arg Gin 
135 140 145 

Til pf nf Hf 9 ^ t9C ° Ca gaC gga gtc act cac t=c ate age 774 
He Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr His Ser lie Ser 



150 155 



160 



ggc cga ate gat gee ace gtg gtc agg ate gga ace ttc tgc age aat 822 
Gly Arg lie Asp Ala Thr Val Val Arg lie Gly Thr Phe Cys Ser Asn 
165 170 



S° T f ? l CC C " atC aag atg Caa gaa gga aaa atg gee tta 
Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val Lys Met Ala Leu 
185 190 



175 180 

870 

Leu 

195 



cac etc cca tgg ttc cac ccc aga aat gtc tee ggc ttc age att gea 918 
His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser lie Ala 
200 205 ' " 



210 



aac cgc tea tct ata aaa cgt ctg tgc ate ate gag tct gtg ttt gag 966 
Asn Arg Ser Ser lie Lys Arg Leu Cys lie lie Glu Ser Val Phe Glu 
215 220 



225 



ggt gaa ggc tea gea ace ctg atg tct gee aac tac cca gaa ggc ttc 1014 
Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe 
230 235 240 



cct gag gat gag etc atg acg tgg cag ttt gtc gtt cct gea cac ctg 
Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val Pro Ala His Leu 



1062 



245 250 



255 260 



egg gee age gtc tec ttc etc aac ttc aac etc tec aac tgt gag agg 1110 
Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn C?s Glu Arq ' 
265 270 " 



275 



aag gag gag egg gtt gaa tac tac ate ccg ggc toe ace acc aac ccc 1158 
Lys Glu Glu Arg Val Glu Tyr Tyr lie Pro Gly Ser Thr Thr Asn Pro 
280 285 



290 



9 ? 1° 339 ° g gag gac aag cag cct 999 aac at 9 9cg ggg aac 1206 
Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn 
295 300 305 

ttc aac etc tct ctg caa ggc tgt gac caa gat gee caa agt cca ggg 1254 
Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly 
320 315 320 

ate etc egg ctg cag ttc caa gtt ttg gtc caa cat cca caa aat gaa 



lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin Asn Glu 

340 



1302 



325 330 335 



tit T «° taC 9tg 9tt gaC ttg agt aat 9 a g cga gee atg tea 1350 
Ser Asn Lys lie Tyr Val Val Asp Leu Ser Asn Glu Arg Ala Met Ser 
345 350 355 
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etc acc ate gag cca egg ccc gtc aaa cag age cgc aag ttt gtc cct 1398 

Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe Val Pro 

360 365 370 

ggc tgt ttc gtg tgt eta gaa tct egg acc tgc agt age aac etc acc 1446 

Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr 
375 380 385 

ctg aca tct ggc tec aaa cac aaa ate tec ttc ctt tgt gat gat ctg 1494 

Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu Cys Asp Asp Leu 

390 395 400 

aca cgt ctg tgg atg aat gtg gaa aaa acc ata age tgc aca gac cac 1542 

Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser Cys Thr Asp His 

405 410 415 420 

egg tac tgc caa agg aaa tec tac tea etc cag gtg ccc agt gac ate 1590 

Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp lie 

425 430 435 

etc cac ctg cct gtg gag ctg cat gac ttc tec tgg aag ctg ctg gtg 1638 

Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu Leu Val 

440 445 450 

ccc aag gac agg etc age ctg gtg ctg gtg cca gee cag aag ctg cag 1686 

Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin 
455 460 465 

cag cat aca cac gag aag ccc tgc aac acc age ttc age tac etc gtg 1734 

Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val 

470 475 480 

gee agt gee ata ccc age cag gac ctg tac ttc ggc tec ttc tgc ccg 1782 

Ala Ser Ala lie Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro 

485 490 495 500 

gga ggc tct ate aag cag ate cag gtg aag cag aac ate teg gtg acc 1830 

Gly Gly Ser lie Lys Gin lie Gin Val Lys Gin Asn lie Ser Val Thr 

505 510 515 

ctt cgc acc ttt gee ccc age ttc caa caa gag gee tec agg cag ggt 187 8 

Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg Gin Gly 

520 525 530 

ctg acg gtg tec ttt ata cct tat ttc aaa gag gaa ggc gtt ttc acg 1926 

Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr 
535 540 545 

gtg acc cct gac aca aaa age aag gtc tac ctg agg acc ccc aac tgg 1974 

Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp 

550 555 560 

gac egg ggc ctg cca tec etc acc tct gtg tec tgg aac ate age gtg 2022 

Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn lie Ser Val 

565 570 575 580 
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ccc aga gac cag gtg gcc tgc ctg act ttc ttt aag gag cqq aac aac ?n7 rt 
Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu 2g Ser Z ™° 
585 590 595 

fJ ?? ?° C ? 9 303 999 C9 ° gca ttc at 9 atc ate cag gag cag cqq 2118 
Val val cys Gin Thr Gly Arg Ala Phe Met lie lie Gin Glu Gin S 

600 605 610 

acc egg get gag gag atc ttc age ctg gac gag gat gtg etc ccc aaa 
Thr Arg A a Glu Glu lie Phe Ser Leu Asp Glu Asp £? £ Pro Lys 

620 625 

S | £ S 2 2 S 2 5 ^ £ £ £ 2 5 £ 

Pro tS Ser gIv Lvs X f ° Ct ° ttC tC9 gt9 aCa Ctt a " 2262 
Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr 



645 650 655 



660 



2310 



cca agg act gtg gac ttg act gtc atc etc atc gca gcg gtq qqa oat 
Pro Arg Thr Val Asp Leu Thr Val lie Leu He Ala 111 Va? lly g 
665 670 675 

ct £? r tta T Ctg Ctg tCt 9CC CtC 939 ctc atc att tgc tgt gtg aaa 2358 
Gly Val Leu Leu Leu Ser Ala Leu Gly Leu lie lie Cys Cys Val Lys 
680 68 5 6go 

aag aag aaa aag aag aca aac aag ggc ccc get gtg ggt atc tac aat 
Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala U £ e Tyr Asn 
695 7 oo 705 

III ITn Jf! I* *f ! 39 at9 CC9 399 Ca9 CCa aaa aa 9 cag aaa 2454 
Gly Asn lie Asn Thr Glu Met Pro Arg Gin Pro Lys Lys Phe Gin Lys 

715 720 



ggg cga aag gac aat gac tec cat gtg tat gca gtc atc gag gac acc 2502 
Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val lie Glu Asp tS 
725 730 735 P 740 

atg gta tat ggg cat ctg eta cag gat tec age qqc tec ttc rlv, „.„ 
Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser lly Ser Phe Leu Gin ° 
745 7 5o ?55 

Pro f ? f C T taC C " CCg ttc cag ggc acc a tg ggg gtc tgt 2598 
Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr Me? SJ Val Cys 
760 765 J 1 



cct ccc tec cca ccc acc ata tgc tec agg gcc cca act qca aaa tta mc 
Pro Pro ser Pro Pro Thr lie Cys Ser Sa Ala Pro £ S Lys 2 
775 780 785 

795 800 
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ccg tac acc ttc tec cat ccc aac aat ggg gat gta age age aag gac 2 742 
Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val Ser Ser Lys Asp 
805 810 815 820 

aca gac att ccc tta ctg aac act cag gag ccc atg gag cca gca gaa 2 790 
Thr Asp lie Pro Leu Leu Asn Thr Gin Glu Pro Met Glu Pro Ala Glu 
825 830 835 

taa cttgatccat tccagacgct ttgctgagtt tcataaagca gggcactgag 2 843 



acacccat cc 


a tat tec taa 


ay exact L. v_« l. 


f-aaa rja a aa a 
l. ct ct cty ct ct y ct y 


rra at*f"af"ara 
yctctL.L.ctL,ctL>ct 


na a nna a/13 /-r 

gctctygaacag 


o q n "3 

z y u j 


caoaaaattt 


l~V^V~ l^yy CI. Civ- 


rarraarfhr 
^-y*-»v-ctctccL-L-> 


arahtripfra 

aLdLL^LtLCl 


y L-yyctu l-l-cil. 


u l, u ct a. gg g c a 


iocs 
z y bo 


aaacattaaa 


a at aa taa at 


t r* f a a t" n t~ rrrr 
l. Vw-^o.c*. L- L- uyy 


at'anant'pat" 

Ct L-CtUcty LCCl L 


rtapanpfpat* 
y ctL-cty u LLdL 


yt.yct.ee tea 


O A O "3 




y yy l» uay 


L-cty ll uy Uctd 


4- <-* 3 narrrra rra 

c y ay cty y dy ct 


y ctyyucuycty 


Lcacctagca 


jUoj 


t a aaa t t ac a 


y i_ciciy i_ v_ i_y 


y d t, L-t-ciy ay u 


rrfhaaaparra 
y t. C. aadC cty ct 


ggee tycee t 


cttcaggaca 


3143 


ciL^ciy l, L-n_ctci 


f* +* r* f* a nna <**t 


CCLaCCLyay 


/T 4* r-1 r - * /-* /^i 4^ 

ytCCCLdCLC 


tcactggggt 


ccccaggatg 


3203 


aaaan era f a a 


L.y uyuu illl. 


L-ct L. LdLLaLL 


tatLtyy cyy 


tCCty tytLd 


tLcaagagat: 


32 63 


paaa tat a t a 

faciei y LCILCI 


CL i— ^- ci t— l. l. cty 


L.L- L- L- L. LLaLL 


t. y ct C L. L. ct y C ct 


dLddCLCaLa 


ctaaccggcc 


*3 "5 n "3 


^yy*^ , y^*^' ^*y 


y y t. uy ty ci t* t- 


LL LdCuyaCC 


yc tag acaaa 


cgtgtgcctg 


tcccccaggt 


33 83 


y y y y j ^ 


at"hfar<aai"P 
aLULaCaaCL. 


L.y LLCdaCCa 


gaaaagaaug 


4-~4- —f. — ,,1. +. 4- — 

ugugcgctxg 


agcagcattg 


3443 


d UuL CI L.CtLLL> 


yt_L-L-L.yctL.cta. 


ydyaLLLCCL 


/^f 4* y-i 4* ^"m 4** *f» 

ydt.LCLCt.dy 


gtcggttcgt 


ggttatccca 


3503 


l. i— y Ly y ci ci ct 


LLclLLL L.y ctct 


4- /-i /— i i'-i a 4— 4~ /-*■+- r* 
LLLLaCCyUC 


ccacagucc u 


agcaataaga 


gaaatttcct 


3563 


r*aacri~ hhrra 


L.y t-y cyy cue 


f~ /-« /-I |- -3 r"T/""' 4- /*T/-» 

LLLLdyCLyC 


agcaauacuc 


cgacauttiaa 


agagaaattt 


3623 


aaaaa a t* a t t 

Ciy ^y L» C* L. L. 


LLLCIL.LULLU 


a a a a a f* rrf~ t*t* 
ct ctct ctct Ly LUU 


dddLdLdLdC 


caaacagegg 


ccccccgcac 


jOOJ 


tagttttctg 


ttgccactgc 


aacccattac 


ttggtagctt 


aaaaacaaca 


cattagctta 


3743 


tagtcctggg 


gatcagaatt 


ccaaaatgga 


tgtcc-ctgaa 


tgaaaatcaa 


ggtgtcagca 


3803 


gagctgtgct 


ccttctgaag 


gctctaggga 


gaagccggtt 


ccttgccatt 


tcaagcttct 


3863 


agaggctggc 


tgcattccca 


ggctccagtg 


gctggtcaag 


cttttctcac 


atggcatcac 


3923 


tgtgacactg 


gccctcccac 


ttccctcttt 


gacttacaaa 


gcccaccagg 


aagatccagg 


3983 


ataatctctc 


catctaaaga 


tccttcatca 


tcctggaaga 


gccttttgcc 


atgeaagaca 


4043 


acatagccac 


aggtggggat 


taggaccagg 


acatctttgg 


ggtgctgtta 


ttctgcctac 


4103 


cacaccttcc 


tgccactgac 


tcccacagga 


gaggctacaa 


aatgatctgg 


cgcacaggga 


4163 


tgttttgttt 


agettgegga 


ctctaacact 


taaaaaaacc 


ccagatcaga 


agatctggee 


4223 


atgctggggc 


tcacattctc 


acctagcaac 


aactggctgg 


agctgggcac 


cagctctgcc 


4283 
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tttagaaggg gtgtccactt caccaggtca ccacagccca cactacgccc tatcacttcc 4343 
cacaatgagg ctaagtgttt gtttctactg atcaatgccc ctgcaggttg catttattgt 4403 
aatgaaaaag aaagactggg attaatctct aatcaggtga gtagaccatg agaccaatgt 4463 
gtgctcacat tacccttttt cttttttttc tttttctttt tctttttttt tttaatgtga 4523 
gacaggatct cattctgttg cctaggctgg agtgcagtgg cgcaatctcg gctcactgca 4583 
acctctgcct cctgggctca agcaattctc ccacctcagc ctcccaaata gctgggatca 4643 
ctggcacaaa ccaccatgcc cagctaattt tgtatttttt gtagagacag ggtttcacca 4703 
tgttgcccag gctggtctca acctcctggg ctcaagcaat cctcctgcct cggcctccca 4763 
aagtgctggg attacagatg tgagccaccg catccagccc cacaccctca tttataccaa 4823 
ttacctgccc agtaactgtg gacttttgct tcctcacccc tgctctgatc tggaaggaga 4883 
gggattatgt tatagcttgt cagcacagtc ccaagttcaa tatttctgcg gcaaaaactt 4943 
ccttcaaaaa ataaatgtac ttcattgtat tcaatgaatt caccttggaa atgcaccgcc 5003 
tcaacttgtt cacatggcat aaatgaaagg aattttatag tctcctaaat ggcgtgtact 5063 
gcaagacctc ttgaacactt tccagaggat aggatattta agtcatgccc ttggcgttgc 5123 
ctatggcacc tttccottct gaaagtctgg ttcctgccca gtgacccttg gccttgtgag 5183 
ccgagatgct gaccctgcat aaagggccaa aggagggctg cggcttcctt ccctcactga 5243 
agagccctta tttgaattca ctgtgtggag ccctagccct ccattctcga cattccccaa 5303 
cctcccagcc ccttccaagc aggactaggt gccctgcatt ccacccaagg tgggattggc 5363 
cttccttagg ctggctactt gtcaccatca ccgacatcac tgttgcctgc aaggacacca 5423 
cgtggccatt ttccttcaac tgagggctca aaactcctgg acaagttgct ggctcctgag 5483 
accagtattt cctggagctg tgcctcagtg aaggggccca gcctgaggaa ccctggctct 5543 
tttctttaaa gcccaggccc cacttacata aaacatttca gggtcactgg aaacagtgaa 5603 
gtgccatttg ttgaagccta ctgcatgcca gcccactgct catccacgtg gtctgccatg 5663 
cctacgagga aggccagcgc atgcaggact ggtctctaat gctgtggtca ttgcacagaa 5723 
gggaaaggtc tcaaggaaga gtcaactggg acaagcacaa gcccaccgga catggccttg 5783 
gtaaaggtta gcagactggt gtgtgtggat ctgcagtgct tcactggaaa taatttattc 5843 
attgcagata ctttttaggt ggcattttat tcatttcctg tgctttaaat aaacaaatgt 5903 
accaaaaaac aagtatcaag ctgtttaagt gcttcggcta cttgtcccct ggttcagtag 5963 
aggccccggt ttcccagttg ttgactgtga caggctcagc atgggctcag cagatgctgt 6023 
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cttaatttgt ggatgataca gaaagccagg ctttgggata caagttcttt cctcttcatt 6083 
tgatgccgtg cactgtgtga agcagatgtt tttgtccgga aataaaaata atagtcttgg 6143 
agtctcgcca aaaaaaaaaa 6163 



<210> 4 

<211> 836 

<212> PRT 

<213> Homo sapiens 

<400> 4 

Met Ala Gly Leu Asn Cys Gly Val Ser lie Ala Leu Leu Gly Val Leu 
1 5 10 15 

Leu Leu Gly Ala Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu lie 
20 25 30 

Ala Leu Pro Arg Glu Ser Asn lie Thr Val Leu lie Lys Leu Gly Thr 
35 40 45 

Pro Thr Leu Leu Ala Lys Pro Cys Tyr lie Val lie Ser Lys Arg His 
50 55 60 

lie Thr Met Leu Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe 
65 70 75 80 

Ser Cys Gin Ser Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn 
85 90 95 

lie Asp Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin 
100 105 110 

Pro Ser Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp 
115 120 125 

Val Lys Ala His Lys Ser lie Gly Leu Glu Leu Gin Phe Ser lie Pro 
130 135 140 

Arg Leu Arg Gin lie Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr 
145 150 155 160 

His Ser lie Ser Gly Arg lie Asp Ala Thr Val Val Arg lie Gly Thr 
165 170 175 

Phe Cys Ser Asn Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val 
180 185 190 

Lys Met Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly 
195 200 205 



Phe Ser lie Ala Asn Arg Ser Ser lie Lys Arg Leu Cys lie lie Glu 
210 215 220 
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s« val P„ e Olu sly Glu Oly Se r u. te „ „ et Set Ma ^ 

235 240 
Pro Glu Gly Phe p,o Glu Asp Glu Leu ^ ^ ^ v ^ 



250 



Pro Ala His Leu Arg Ala Ser Val Ser Phe Leu 



260 



265 



255 



Asn Phe Asn Leu Ser 



270 



Asn Cys Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr II 



280 



285 



e Pro Gly Ser 



rhr Thr Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn 

300 

Met Ala Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala 

315 320 
Gin Ser Pro Gly lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His 



330 



335 



Pro Gin Asn Glu Ser Asn Lys He Tyr Val Val Asp Leu 
340 



345 



Ser Asn Glu 
350 



Arg Ala Met Ser Leu Thr lie Glu Pro Arg Pro Val Lys Gin 



360 



365 



Lys Phe Val Pro Gly Cys. Phe Val Cys Leu Glu Ser Arg Thr 



375 



380 



Ser Arg 



Cys Ser 



Ser Asn Leu Thr Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe 



390 



395 



Leu 
400 



Cys Asp Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser 

410 415 
Cys Thr Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val 

425 430 

Pro ser Asp lie Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp 

440 445 

Lys Leu Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala 



455 



460 



Gin Lys Leu Gin Gin His Thr His Glu Lys Pro Cys 



470 



475 



Asn Thr Ser Phe 
480 



Ser Tyr Leu Val Ala Ser Ala He Pro Ser rin ^ r ^ 

485 p Leu ^ Phe G1 y 

490 495 

S« Ph. cys Pro Oly Gly ser He Ly. G lo He 01„ V,l Lys Gl„ ^ 

505 510 
He Ser Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala 



520 



525 
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Ser Arg Gin Gly Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu 
530 535 540 

Gly Val Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg 
545 550 555 560 

Thr Pro Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp 
565 570 575 

Asn lie Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys 
580 585 590 

Glu Arg Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met He He 
595 600 605 

Gin Glu Gin Arg Thr Arg Ala Glu Glu He Phe Ser Leu Asp Glu Asp 
610 615 620 

Val Leu Pro Lys Pro Ser Phe His His His Ser Phe Trp Val Asn He 
625 630 635 640 

Ser Asn Cys Ser Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser 
645 650 655 

Val Thr Leu Thr Pro Arg Thr Val Asp Leu Thr Val He Leu He Ala 
660 665 670 

Ala Val Gly Gly Gly Val Leu Leu Leu Ser Ala Leu Gly Leu He He 
675 680 685 

Cys Cys Val Lys Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val 
690 695 700 

Gly He Tyr Asn Gly Asn He Asn Thr Glu Met Pro Arg Gin Pro Lys 
705 710 715 720 

Lys Phe Gin Lys Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val 
725 730 735 

He Glu Asp Thr Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser Gly 
740 745 750 

Ser Phe Leu Gin Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr 
755 760 765 

Met Gly Val Cys Pro Pro Ser Pro Pro Thr He Cys Ser Arg Ala Pro 
770 775 780 

Thr Ala Lys Leu Ala Thr Glu Glu Pro Pro Pro Arg Ser Pro Pro Glu 
785 790 795 800 



Ser Glu Ser Glu Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val 
805 810 815 



Ser Ser Lys Asp Thr Asp He Pro Leu Leu Asn Thr Gin Glu Pro Met 
820 825 830 
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835 



<210> 5 
<211> 23 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 5 

accgcctcaa cttgttcaca tgg 



23 



<210> 6 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 6 

ctggtctcag gagccagcaa cttgtc 



<210> 7 
<211> 25 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 7 

ctcatgacgt ggcagtttgt cgttc 



<210> 8 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 8 

ggctcgctca ttactcaagt caacca 



26 
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<210> 9 
<211> 36 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 9 

attcgcgact gatgatcgat tttttttttt tttttt 36 



<210> 10 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<210> 11 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 11 

gagatattag aattctactc 20 



<210> 12 
<211> 17 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<400> 10 

attcgcgact gatgatcgat 



20 



<400> 12 

gagtagaatt ctaatat 



17 



<210> 13 
<211> 22 
<212> DNA 



<213> Kiinstliche Sequenz 



<220> 
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<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 13 

agtccatgtg aacaagttga gg 



22 



<210> 14 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 14 

aattctccca cctcagcctc 

20 



<210> 15 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 15 

aggatgaaaa cgacaatgtg cc 



22 



<210> 16 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 16 

agaattgctt gagcccagga g 



<210> 17 
<2U> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 17 

caacttcaca ttgctcagtg g 



21 



21 
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<210> 18 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 18 

tgagcaagtt cagcctggtt aagtc 25 



<210> 19 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<210> 20 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 20 

tagacttcga gcaggagatg gccact 26 



<210> 21 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 19 

caccgaatac tcataaagaa ggtccc 



26 



<400> 21 

ccagccatgt acgtagccat 



20 



<210> 22 
<211> 19 
<212> DNA 



<213> Kunstliche Sequenz 



<220> 
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<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 22 

ccaagaagga aggctggaa 



<210> 23 
<211> 25 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 23 

ccatcaccat cttccaggag cgaga 



<210> 24 
<211> 19 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 24 

ccaagaagga aggctggaa 



<210> 25 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 25 

tgcaggaggc attgctgatg 



<210> 26 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 26 

aaatcgtgca cttgcaggc 



19 



25 



19 



20 



19 
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<210> 27 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 27 

ttgatgcgtt ccagctga 18 



<210> 28 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<210> 29 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 29 

tgcaggcaac agtgatgtc 19 



<210> 30 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<400> 28 

ttgaattcac tgtgtggagc c 



21 



<400> 30 

attggccttc cttaggctgg ctac 



24 



<210> 31 
<211> 43 
<212> DNA 



<213> Kunstliche Sequenz 



<220> 
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<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 31 

tgtagcgtga agacgacaga aagggcgtgg taccgagct. 



c gag 43 



<210> 32 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 32 

a gggcgtggt accgagctcg ag 



22 



<210> 33 
<2U> 11 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 

<400> 33 
ggctcgagct c 

11 



<210> 34 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 34 

ggccatgtcc ggtgggcttg tg 

22 



<210> 35 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 35 

ctcaaaactc ctggacaagt tgctgg 

26 
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<210> 36 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 36 

aaggtgaagg tcggagtcaa eg 22 



<210> 37 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 37 

ggcagagatg atgacccttt tggc 24 



<210> 38 
<211> 23 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> 5»UTR 
<222> (1) . . (282) 

<220> 

<221> GC_signal 
<222> (147) . . (157) 

<220> 

<221> misc_feature 
<222> (201) . . (209) 

<223> cap signal; Transkript ions start 
<220> 

<221> 3»UTR 

<222> (2794) . . (6163) 

<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 



<400> 38 

agcagcagaa cccctagcag tgc 



23 
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<210> 39 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 39 

agaaccccta gcagtgcgat agagac 26 



<210> 40 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<400> 40 

gaactgtaat gttgctttct cgtggca 



27 
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